DNS-metabarkódolás és a citokróm c oxidáz I. alegység marker: nem tökéletes egyezés
Bevezetés
A megfizethető, nagy áteresztőképességű DNS-szekvenálás (HTS) új lehetőségeket nyitott a biológiai sokféleség DNS-alapú felmérésében. Ez a megközelítés a mikrobiológia területén a legfejlettebb, ahol a molekuláris taxonómiának nagy hagyománya van, és az elemzések ma már rendszeresen használják a HTS-t a markerek jellemzésére a taxonómiai és a funkcionális diverzitás becsléséhez. Az amplifikált “vonalkód” géneket egyre gyakrabban használják a növények, gerinctelenek és gerincesek azonosítására is, amelyek DNS-keverékekben vannak jelen – amelyeket vagy összevont mintákból vagy környezeti mintákból (pl. talaj, víz és ürülék) származó teljes DNS kivonásával nyernek. A DNS-vonalkódoknak a DNS-keverékekből történő jellemzését “metabarkódolásnak” nevezik.
Az olcsó és megbízható szekvenciaadatok iránti igényen túl a metabarkódoláshoz megfelelő markerre is szükség van. Az egyes állatminták standard DNS-strakkódolásához a Consortium for the Barcode of Life (CBOL) a mitokondriális citokróm c oxidáz I. alegység (COI) génjét fogadta el. Ez a marker rendelkezik a szükséges tulajdonságokkal: variációja általában lehetővé teszi a fajszintű megkülönböztetést, a legtöbb állatból PCR-rel amplifikálható, és a kapcsolódó adatbázis ma már több millió taxonómiailag ellenőrzött DNS-szekvenciával büszkélkedhet. Kézenfekvő választásnak tűnik az állatok metabarkódolásának kialakulóban lévő területén, és a közelmúltban számos tanulmányban alkalmazták, többek között a biológiai sokféleség felmérésében, a környezeti monitorozásban és a táplálkozási tanulmányokban (példák az elektronikus kiegészítő anyagban).
Mi a baj a citokróm c oxidáz I. alegységgel mint metabarkódoló markerrel?
Míg a COI a fajok óriási választékából amplifikálható, mindig is elismerték, hogy a primer-kötőhelyek ezen a fehérjét kódoló génen belül nem nagyon konzerváltak. Sok nukleotidpozícióban bekövetkező mutációk nem változtatják meg a kódolt fehérjét (általában a triplett kód utolsó bázisát), és a szelekció kevésbé korlátozza őket. Ennek megfelelően számos primert terveztek különböző állatcsoportok COI-jának amplifikálására (jelenleg több mint 400 COI-primer található a CBOL primer-adatbázisban). A COI vonalkód régióját amplifikáló “univerzális” primereket is leírtak, de az in silico elemzés azt mutatja, hogy ezek kevéssé konzerváltak (; 1. ábra). Empirikus vizsgálatok azt mutatják, hogy ez a primer-variabilitás megbízhatatlan amplifikációt eredményez, amikor a minták széles rendszertani tartományt lefedő fajokat tartalmaznak (pl. 44%-os sikeresség több mint 2000 kezdeti amplifikáció során; Moorea Biocode Project ). A standard DNS-strakkódolás során lehetőség van a protokollok optimalizálására, hogy a kezdetben sikertelenül amplifikálódó mintákból is kapjunk adatokat. A DNS-keverék metabarkódolásakor azonban bizonyos taxonok sikertelen amplifikációját elrejti a mintában jelen lévő más taxonok amplikonjainak visszanyerése. Ez megnehezíti a protokoll optimalizálását. Továbbá néhány várt szekvencia helyreállítása hamis bizalmat ad az eredményül kapott adatkészletnek.
Számos mikrobiális ökológiai vizsgálat kimutatta, hogy bár a hibásan illeszkedő primerek képesek különböző bakteriális genomok DNS-ének felerősítésére, a tökéletes homológia nélküli célpontok alacsonyabb és gyakran kiszámíthatatlan hatékonysággal amplifikálódnak . Egyes esetekben akár egyetlen bázis eltérés is 1000-szeres alulbecslést eredményezhet a bőségben, így egyes baktériumok “szinte kimutathatatlanná” válnak a próbaközösségek HTS-elemzése során. A több primerváltozatot tartalmazó koktélok használata növelheti az amplifikáció sikerességét a standard DNS-strakkódolásban, de a legújabb értékelések alapján ezek nem jelentenek csodaszert a COI-metabarkódolásban. Ez valószínűleg annak köszönhető, hogy a COI-primerekhez kötődő régiókban a labilis helyek gyorsan eltérnek egymástól (2. ábra). Ezért a variabilitás figyelembevételéhez szükséges primerek száma, még a viszonylag közeli rokonságban álló taxonok között is, gyorsan tarthatatlanná válik. Ráadásul nem minden ilyen primer szekvencia lesz hatékony a DNS felerősítésében (további megbeszélés az elektronikus kiegészítő anyagban). A COI-metabarkód-primerek tervezésénél külön problémát jelent, hogy a kevésbé korlátozott helyeken a homoplasia következtében a variáció a távolabbi rokon taxonok között telítetté válik (2. ábra). A szekvencia-divergenciának ez a platója akadályozza a csoportspecifikus primerek kifejlesztését (pl. az összes rovart megcélozva, de más szárazföldi ízeltlábúakat kizárva).
A fenti korlátok ellenére számos COI-primer-készletet fejlesztettek ki kifejezetten metabarcodingra. Például számos COI “mini-barcoding” primert tettek közzé a lebomlott templátból kinyerhető rövid fragmentumok amplifikálására, annak ellenére, hogy a primerhelyek a célfajok között eltérőek, és alternatív markerek alkalmasabbnak tűnnek (1. ábra). Metabarcoding-primer-koktélokat is terveztek a teljes COI-vonalkódolási régió felerősítésére tengeri gerinctelenekben, annak ellenére, hogy a kötőhelyek nukleotidjainak kevesebb mint 50%-a konzervált a céltaxonokban.
A legjobb elfogadni a torzulásokat és ragaszkodni a standard vonalkódmarkerekhez a metabarcodinghoz?
Azzal lehet érvelni, hogy a COI-primerek eltérő kötődése által okozott torzulások kezelhetőek, ha az összehasonlított mintákban következetesek és a szekvenálást megfelelő mélységben végzik. Továbbá ez egy kis engedménynek tekinthető, tekintve, hogy a COI lehetővé teszi a taxonómiailag ellenőrzött példányokhoz kapcsolódó számos vonalkódszekvenciához való hozzáférést. Úgy véljük azonban, hogy még a legjobb COI-metabarkódolási vizsgálatok is rávilágítanak e marker korlátaira, és jelzik, hogy komolyan meg kell fontolni alternatívák alkalmazását. Yu és munkatársai például az ízeltlábúak mintáiból származó COI tömeges szekvenálásával kapcsolatos munkájukban a biológiai sokféleség elemzéséhez 24% (2 olvasásnál nagyobb küszöbérték) és 36% (5 olvasásnál nagyobb küszöbérték) közötti kiesési arányt dokumentáltak az ismert bemeneti adatokhoz képest, még teljesen degenerált primerek használata esetén is. Bár az így kapott adatok a természetvédelmi szempontból fontos döntésekhez hasznos α- és β-diverzitás becsléseket eredményeznek, az ilyen szintű torzítás elfogadása minden bizonnyal korlátozza a jövőbeli alkalmazásokat. A kiesésre hajlamos taxonok előfordulásának eltérése a mintacsoportok között potenciálisan torzíthatja az összes taxon relatív fontosságát, ami megnehezíti a csoportok közötti biológiailag releváns különbségek értékelését.
Ha az előzetes módszertani értékelések nem átfogóak és az adathalmaz korlátait nem veszik figyelembe, az adatok értelmezése nehézségekbe ütközik. Egy nemrégiben végzett, rovarok metabarkódoló markereit értékelő tanulmányban a széles körben használt “általános ízeltlábúak” COI metabarkódoló primerek csak a fajok 43-64%-át tudták visszanyerni egy ismert ízeltlábú DNS-keverékből. Az ilyen primerekkel előállított adatokra támaszkodó ökológiai tanulmányok visszamenőleges értékelése nehéz; egyes esetekben azonban a következtetéseket nem a biológia, hanem a primer preferenciái határozhatják meg.
A szekvenálási mélység növelése a rosszul amplifikált markerek kimutatása érdekében valószínűleg nem jelent megbízható megoldást, mivel ezzel párhuzamosan megnő a kisebb szennyeződésekből és kiméra molekulákból származó szekvenciák száma. Az ilyen alacsony szintű háttérhibák kiszűrésére és a legitim ritka szekvenciák azonosítására használt módszerek tökéletlenek. Továbbá az alacsony szintű hibák beépítése a metabarkódolási adatkészletekbe aránytalanul nagy hatással lehet, mivel az összefoglalók jellemzően incidencia-alapúak (azaz jelenlét/hiány), és nem tartalmaznak információt a szekvenciák gyakoriságáról.
Annak ellenére, hogy a nagy COI referencia adatbázis a marker egyik erős értékesítési érve, számos COI metabarkódolási tanulmány a visszanyert szekvenciákat operatív rendszertani egységekhez (OTU) kapcsolja, ahelyett, hogy nagy felbontású rendszertani információt adna . Ez részben a mikrobiális ökológusok bioinformatikai megközelítéseinek átvételét tükrözi, de a globális COI-adatbázis lefedettségének hiányát is. A COI-referenciaszekvenciák nagy gyűjteménye segíthet javítani az általános taxonómiai hozzárendeléseket (pl. családhoz vagy nemzetséghez), de sok tanulmányban helyileg kifejlesztett adatbázisokra lesz szükség, ha a szándék az OTU-indikátoroktól való eltávolodás és a biológiához való visszatérés . Ez megnyitja a lehetőséget a metabarkódoláshoz jobban illeszkedő, nem szabványos vonalkódjelzők szekvenálására, ha azt megfelelőnek ítélik. A metabarkódoláshoz használt marker rugalmassága szükséges egyes állatcsoportok, például a fonálférgek esetében, ahol a COI a szekvencia diverzitása miatt nem megfelelő. Hasonló problémák merülnek fel a “hivatalos” növényi vonalkódok esetében is, aminek következtében számos növényi metabarkódolási vizsgálatban “nem hivatalos” markereket választanak.
Mi a jövő útja?
A metabarkódolás pontossága nagyban függ a marker kiválasztásától, de sajnos nem létezik tökéletes metabarkódoló marker. Ehelyett a legjobb markerválasztás vizsgálat-specifikus lesz. A nagymértékben konzervált primerek tervezéséhez gyakran nagyon hasznos a riboszomális RNS (rRNS) génekben megfigyelhető mozaikos variációs mintázat (1. ábra). Ezeket a géneket már sokan elfogadták az állati metabarkódoló közösségben, és standard markerek a gombák és a baktériumok/archeák azonosításához. Az állatok esetében a nukleáris rRNS-gének nagyon széles rendszertani lefedettséget, de alacsonyabb rendszertani felbontást biztosítanak, míg a mitokondriális rRNS-gének a COI-hoz hasonló rendszertani felbontást biztosítanak, de általában konzerváltabb primerek tervezését teszik lehetővé (1. ábra). Az rRNS-gén szekvenciák taxonokhoz való hozzárendelésének vélt nehézségei, amelyek a szekvenciák pontos összehangolásának képtelenségéből adódnak, nagyrészt leküzdhetők az összehangolásmentes módszerek segítségével . Az rRNS kódoló régiók hosszváltozása azonban potenciálisan taxon-specifikus különbségeket okozhat a szekvenciák helyreállításában. Az is igaz, hogy a fehérje gének könnyebb összehangolása lehetővé teszi egyes szekvenálási hibák korrekcióját . A fontos pont az, hogy a lehetséges primerek széles skáláját és a kapott amplikonok taxonómiai felbontását gondosan mérlegelni kell minden metabarkódolási alkalmazásban. A primerek könnyen értékelhetők in silico a rendelkezésre álló programok (pl. ecoPCR ) segítségével; az empirikus tesztelés további biztosítékot nyújt arra, hogy a primerek alkalmasak egy adott alkalmazáshoz .
Elképzeléseink szerint a metabarkódolás végül rutinszerűen több vonalkódmarkert fog szekvenálni minden egyes mintából . A különböző taxonómiai szinteket célzó markerek leküzdhetik a taxonómiai szélesség és a felbontás közötti kompromisszumot. Az összehasonlítható rendszertani információt nyújtó markerek belső kontrollként szolgálhatnak; ezek különösen hasznosak lennének a validáláshoz olyan esetekben, amikor a primer-minta eltérések potenciális problémát jelentenek. A feldúsított mtDNS tömeges, amplifikáció nélküli szekvenálásán alapuló metabarkódolási megközelítéseket egy koncepciót igazoló tanulmányban mutatták be. Ez a munka egy olyan jövő felé mutathat, ahol a PCR-primerek kevésbé fontosak; az eddig vázolt módszerek azonban ép mtDNS-molekulákat igényelnek, és nem alkalmazhatók, ha a DNS erősen fragmentált. Az olyan alternatív marker-dúsítási technikák, amelyek többféle mintával dolgoznak, mint például a szondák befogásán alapuló megközelítések, alkalmasabbak lehetnek a konzervált célterületeket tartalmazó, nem COI-markerekhez.
Megértjük, hogy vannak olyan helyzetek, amikor jelenleg a COI lehet az előnyös megoldás metabarcoding markerként (pl. amikor a taxonómiai hatókör korlátozott és a fajszintű azonosítás kritikus, vagy amikor a meglévő referencia-adatbázis alapvető fontosságú). Ha a jövőbeni technikák lehetővé teszik a COI kevésbé torzított visszanyerését DNS-keverékekből, a COI jól alkalmazható lenne metabarkódolásra. Még ha alternatív markerek kerülnek is alkalmazásra, a CBOL által kifejlesztett DNS-strakkódolási infrastruktúra létfontosságú lesz ezen a területen. A taxonómiailag ellenőrzött utalványminták és a hozzájuk tartozó DNS-kivonatok felbecsülhetetlen erőforrást jelentenek, amelyek megkönnyíthetik további markerek nagy áteresztőképességű jellemzését. Ugyanilyen hasznos a CBOL adatbázisa, amely az utalványmintákhoz kapcsolódó referenciaszekvenciákat tartalmaz (beleértve a “nem hivatalos” vonalkód szekvenciákat is), valamint a CBOL taxonómiai metaadatainak a GenBankban nyilvánosan hozzáférhető szekvenciákkal való összekapcsolására irányuló erőfeszítések. Izgatottan várjuk, hogy a metabarkódolás gyorsabb és olcsóbb módszert kínál az állati biodiverzitás mérésére, de a markerek kiválasztását alaposabban meg kell vizsgálni, és a rendelkezésre álló markerválasztékot bővíteni kell a nagyobb megbízhatóság érdekében.
Adatok hozzáférhetősége
A GenBankból kinyert és az 1. és 2. ábra elkészítéséhez felhasznált DNS-szekvenciákat elektronikus kiegészítő adatként letétbe helyeztük.
Köszönet
Köszönjük kollégáinknak a témával kapcsolatos vitákat. Köszönjük továbbá a három bírálónak a kritikai észrevételeket, amelyek segítettek a kézirat javításában.
Finanszírozási nyilatkozat
B.D. és S.J. az Australian Antarctic Science Program (AAS Projects 4014 és 4313) működési támogatásában részesült.
Footnotes
- 1
Taberlet P, Coissac E, Hajibabaei M& Rieseberg LH. 2012Environmental DNA. Mol. Ecol. 21, 1789-1793. (doi:10.1111/j.1365-294X.2012.05542.x). Crossref, PubMed, ISI, Google Scholar
- 2
Yu DW, Ji Y, Emerson BC, Wang X, Ye C, Yang C& Ding Z. 2012Biodiversity soup: metabarcoding of arthropods for rapid biodiversity assessment and biomonitoring. Methods Ecol. Evol. 3, 613-623. (doi:10.1111/j.2041-210X.2012.00198.x). Crossref, ISI, Google Scholar
- 3
Ficetola GF, Coissac E, Zundel S, Riaz T, Shehzad W, Bessiere J, Taberlet P& Pompanon F. 2010An in silico approach for the evaluation of DNA barcodes. BMC Genomics 11, e434. (doi:10.1186/1471-2164-11-434). Crossref, PubMed, ISI, Google Scholar
- 4
Geller J, Meyer C, Parker M& Hawk H. 2013Redesign of PCR primers for mitochondrial cytochrome c oxidase subunit I for marine invertebrates and application in all-taxa biotic surveys. Mol. Ecol. Resour. 13, 851-861. (doi:10.1111/1755-0998.12138). Crossref, PubMed, ISI, Google Scholar
- 5
Klindworth A, Pruesse E, Schweer T, Peplies J, Quast C, Horn M& Glockner FO. 2013Evaluation of general 16S ribosomal RNA gene PCR primers for classical and next-generation sequencing-based diversity studies. Nucleic Acids Res. 41, e1. (doi:10.1093/nar/gks808). Crossref, PubMed, ISI, Google Scholar
- 6
Bru D, Martin-Laurent F& Philippot L. 2008Az egyetlen primer-template mismatch káros hatásának számszerűsítése valós idejű PCR segítségével a 16S rRNS gén példáján. Appl. Environ. Microbiol. 74, 1660-1663. (doi:10.1128/aem.02403-07). Crossref, PubMed, ISI, Google Scholar
- 7
Schloss PD, Gevers D& Westcott SL. 2011Reducing the effects of PCR amplification and sequencing artifacts on 16S rRNS-based studies. PLoS ONE 6, e27310. (doi:10.1371/journal.pone.0027310). Crossref, PubMed, ISI, Google Scholar
- 8
Clarke LJ, Soubrier J, Weyrich LS& Cooper A. In press: Environmental metabarcodes for insects: in silico PCR reveals potential for taxonomic bias. Mol. Ecol. Resour. (doi:10.1111/1755-0998.12265). ISI, Google Scholar
- 9
Ji Y, et al.2013Reliable, verificable and efficient monitoring of biodiversity via metabarcoding. Ecol. Lett. 16, 1245-1257. (doi:10.1111/ele.12162). Crossref, PubMed, ISI, Google Scholar
- 10
De Barba M, Miquel C, Boyer F, Mercier C, Rioux D, Coissac E& Taberlet P. 2014DNA metabarcoding multiplexing and validation of data accuracy for diet assessment: application to omnivorous diet. Mol. Ecol. Resour. 14, 306-323. (doi:10.1111/1755-0998.12188). Crossref, PubMed, ISI, Google Scholar
- 11
Leray M, Yang JY, Meyer CP, Mills SC, Agudelo N, Ranwez V, Boehm JT& Machida RJ. 2013A mitokondriális COI régió egy rövid fragmentumát célzó új, sokoldalú primer készlet a metazoák diverzitásának metabarkódolásához: alkalmazás a korallzátonyhalak béltartalmának jellemzésére. Front. Zool. 10, e34. (doi:10.1186/1742-9994-10-34). Crossref, PubMed, ISI, Google Scholar
- 12
Little DP. 2011DNS-vonalkód szekvencia azonosítása a taxonómiai hierarchia és a taxonon belüli variabilitás figyelembevételével. PLoS ONE 6, e20552. (doi:10.1371/journal.pone.0020552). Crossref, PubMed, ISI, Google Scholar
- 13
Deagle BE, Kirkwood R& Jarman SN. 2009Analysis of Australian fur seal diet by pyrosequencing prey DNA in faeces. Mol. Ecol. 18, 2022-2038. (doi:10.1111/j.1365-294X.2009.04158.x). Crossref, PubMed, ISI, Google Scholar
- 14
Zhou X, et al.2013Ultra-deep sequencing enables high-fidelity recovery of biodiversity for bulk arthropod samples without PCR amplification. GigaScience 2, 4. (doi:10.1186/2047-217X-2-4). Crossref, PubMed, ISI, Google Scholar
- 15
Shokralla S, Gibson JF, Nikbakht H, Janzen DH, Hallwachs W& Hajibabaei M. 2014Next-generation DNA barcoding: using next-generation sequencing to enhance and accelerate DNA barcode capture from single specimens. Mol. Ecol. Resour. 14, 892-901. (doi:10.1111/1755-0998.12236). PubMed, ISI, Google Scholar
.