Metabarcoding DNA a marker podjednotky I cytochrom c oxidázy: ne dokonalá shoda
Úvod
Dostupnost cenově dostupného vysoce výkonného sekvenování DNA (HTS) otevřela nový svět možností v průzkumu biodiverzity na základě DNA. Tento přístup je nejpokročilejší v oblasti mikrobiologie, kde má molekulární taxonomie dlouhou tradici a analýzy nyní pravidelně využívají HTS k charakterizaci markerů pro odhady taxonomické i funkční diverzity. Amplifikované „čárové kódy“ genů se také stále častěji používají k identifikaci rostlin, bezobratlých a obratlovců přítomných ve směsích DNA – získaných buď extrakcí celkové DNA ze sdružených vzorků, nebo ze vzorků životního prostředí (např. půdy, vody a trusu). Tato charakterizace čárových kódů DNA ze směsí DNA byla označena jako „metabarcoding“ .
Kromě požadavku na levné a spolehlivé sekvenční údaje potřebuje metabarcoding také vhodný marker. Pro standardní čárové kódování DNA jednotlivých živočišných vzorků přijalo Konsorcium pro čárový kód života (CBOL) mitochondriální gen cytochrom c oxidázy podjednotky I (COI). Tento marker má požadované vlastnosti: jeho variabilita obvykle umožňuje rozlišení na úrovni druhu, lze jej amplifikovat pomocí PCR z většiny zvířat a související databáze se nyní může pochlubit miliony taxonomicky ověřených sekvencí DNA. Zdá se, že je to jasná volba markeru ve vznikajícím oboru metabarcodingu živočichů, a byl použit v mnoha nedávných studiích, včetně aplikací v průzkumech biodiverzity, monitorování životního prostředí a dietních studiích (příkladové studie jsou uvedeny v elektronickém doplňkovém materiálu).
Co je tedy špatného na podjednotce I oxidázy cytochromu c jako markeru pro metabarcoding?
Ačkoli lze COI amplifikovat z obrovského množství druhů, vždy se uznávalo, že vazebná místa primerů v tomto genu kódujícím bílkoviny nejsou vysoce konzervovaná. Mutace na mnoha nukleotidových pozicích nemění kódovaný protein (obvykle poslední báze kódového tripletu) a jsou méně omezeny selekcí. V souladu s tím bylo navrženo velké množství primerů pro amplifikaci COI z různých skupin živočichů (v současné době je v databázi primerů CBOL více než 400 primerů COI). Byly také popsány „univerzální“ primery amplifikující oblast čárového kódu COI, ale analýza in silico ukazuje, že jsou málo konzervované (; obrázek 1). Empirické studie ukazují, že tato variabilita primerů vede k nespolehlivé amplifikaci, pokud vzorky zahrnují druhy pokrývající široké taxonomické rozpětí (např. 44% úspěšnost při více než 2000 počátečních amplifikacích; Moorea Biocode Project ). Při standardním čárovém kódování DNA je možné optimalizovat protokoly tak, aby bylo možné získat údaje ze vzorků, které se zpočátku nepodařilo amplifikovat. Při metabarcodování směsi DNA je však neúspěšná amplifikace určitých taxonů maskována obnovou amplikonů jiných taxonů přítomných ve vzorku. To ztěžuje optimalizaci protokolu. Obnova některých očekávaných sekvencí navíc poskytuje falešnou důvěru ve výsledný soubor dat.
Mnoho studií mikrobiální ekologie ukázalo, že ačkoli neshodné primery jsou schopny amplifikovat DNA z různých bakteriálních genomů, cíle bez dokonalé homologie amplifikují s nižší a často nepředvídatelnou účinností . V některých případech může i jediná neshoda bází vést k tisícinásobnému podhodnocení abundance , což činí některé bakterie „téměř nedetekovatelnými“ při HTS analýze maketových společenstev . Použití koktejlů s několika variantami primerů může zvýšit úspěšnost amplifikace při standardním DNA barcodingu , ale na základě nedávných hodnocení nejsou všelékem pro COI metabarcoding . To je pravděpodobně způsobeno skutečností, že labilní místa ve vazebných oblastech primerů COI se rychle liší (obrázek 2). Proto se počet primerů potřebných k zohlednění variability i mezi relativně blízce příbuznými taxony rychle stává neudržitelným. Navíc ne všechny tyto sekvence primerů budou účinné při amplifikaci DNA (další diskuse v elektronickém doplňkovém materiálu). Samostatným problémem pro návrh primerů COI metabarcodu je, že variabilita na méně omezených místech se mezi vzdáleně příbuznými taxony nasytí v důsledku homoplazie (obrázek 2). Toto plató v sekvenční divergenci brání vývoji skupinově specifických primerů (např. zaměřených na všechen hmyz, ale s vyloučením ostatních suchozemských členovců).
Nehledě na tato omezení bylo vyvinuto několik sad primerů COI speciálně pro metabarcoding. Například byla publikována řada primerů COI „mini-barcoding“ pro amplifikaci krátkých fragmentů obnovitelných z degradovaného templátu, přestože místa primerů se u jednotlivých cílových druhů liší a jako vhodnější se jeví alternativní markery (obrázek 1). Byly také navrženy koktejly primerů pro metabarcoding, které amplifikují celou oblast čárového kódu COI u mořských bezobratlých, přestože méně než 50 % nukleotidů na vazebných místech je u cílových taxonů konzervováno.
Je nejlepší přijmout zkreslení a zůstat u standardních markerů čárového kódu pro metabarcoding?
Mohlo by se tvrdit, že zkreslení způsobená rozdílnou vazbou primerů COI jsou zvládnutelná, pokud jsou konzistentní u všech porovnávaných vzorků a sekvenování se provádí v dostatečné hloubce. Navíc by to mohlo být považováno za malý ústupek vzhledem k tomu, že COI umožňuje přístup k velkému počtu sekvencí čárových kódů spojených s taxonomicky ověřenými vzorky. Domníváme se však, že i ty nejlepší studie metabarcodingu COI poukazují na omezení tohoto markeru a naznačují, že by se mělo vážně uvažovat o alternativách. Například práce Yu et al. o hromadném sekvenování COI ze vzorků členovců pro analýzu biodiverzity dokumentovala míru výpadku mezi 24 % (práh více než 2 čtení) a 36 % (práh více než 5 čtení) ve srovnání se známými vstupy, a to i při použití plně degenerovaných primerů. Ačkoli výsledné údaje poskytují odhady α- a β-diverzity užitečné pro rozhodnutí důležitá z hlediska ochrany přírody , akceptace této úrovně zkreslení jistě omezí budoucí aplikace. Rozdíly ve výskytu taxonů náchylných k vypadávání mezi skupinami vzorků mohou potenciálně zkreslit relativní význam všech taxonů, což ztěžuje posouzení biologicky relevantních rozdílů mezi skupinami.
Když předběžné metodické hodnocení není komplexní a nejsou zohledněna omezení souboru dat, interpretace dat je plná obtíží. V nedávné studii hodnotící metabarcodingové markery hmyzu , sada široce používaných „generických členovců“ COI metabarcodingových primerů dokázala obnovit pouze 43 až 64 % druhů ve známé směsi DNA členovců. Retrospektivní hodnocení ekologických studií závislých na údajích získaných z těchto primerů je obtížné; v některých případech však mohou být závěry ovlivněny spíše preferencemi primerů než biologií.
Zvětšování hloubky sekvenování, které by umožnilo detekci špatně amplifikovaných markerů, pravděpodobně nebude spolehlivým řešením, protože současně dojde ke zvýšení počtu sekvencí pocházejících z drobné kontaminace a chimérických molekul . Metody používané k odfiltrování těchto chyb nízké úrovně pozadí a identifikaci legitimních vzácných sekvencí jsou nedokonalé. Kromě toho může mít začlenění chyb nízké úrovně do souborů metabarcodingových dat nepřiměřený vliv, protože souhrny jsou obvykle založeny na výskytu (tj. přítomnost/nepřítomnost) a neobsahují informace o početnosti sekvencí.
Přestože je velká referenční databáze COI silným prodejním argumentem tohoto markeru, mnoho studií metabarcodingu COI spojuje získané sekvence s operačními taxonomickými jednotkami (OTU), místo aby poskytovalo taxonomické informace s vysokým rozlišením . Částečně to odráží přijetí bioinformatických přístupů od mikrobiálních ekologů, ale také to odráží nedostatečné pokrytí v rámci globální databáze COI. Velká sbírka referenčních sekvencí COI může pomoci zlepšit široké taxonomické přiřazení (tj. k čeledi nebo rodu), ale v mnoha studiích budou zapotřebí lokálně vytvořené databáze, pokud je záměrem odklonit se od ukazatelů OTU a vrátit se k biologii . To otevírá možnost sekvenování nestandardních markerů čárových kódů, které jsou vhodnější pro metabarcoding, pokud to bude považováno za vhodné. Flexibilita v tom, který marker se použije pro metabarcoding, je nutností u některých skupin živočichů, jako jsou hlístice, kde se uznává, že COI je nevhodný kvůli sekvenční diverzitě. Podobné problémy existují také u „oficiálních“ čárových kódů rostlin, což vede k tomu, že mnoho studií metabarcodingu rostlin volí „neoficiální“ markery.
Jaká je cesta vpřed?
Přesnost metabarcodingu je velmi závislá na výběru markeru, ale dokonalý marker pro metabarcoding bohužel neexistuje. Místo toho bude nejlepší volba markeru záviset na konkrétní studii. Pro navrhování vysoce konzervativních primerů je často velmi užitečný mozaikovitý vzor variability pozorovaný u genů ribozomální RNA (rRNA) (obr. 1). Tyto geny již byly přijaty mnoha členy komunity zabývající se metabarcodingem živočichů a jsou standardními markery pro identifikaci hub a bakterií/archeí. U živočichů poskytují jaderné geny rRNA velmi široké taxonomické pokrytí, ale nižší taxonomické rozlišení, zatímco mitochondriální geny rRNA poskytují taxonomické rozlišení podobné COI, ale obvykle umožňují návrh konzervativnějších primerů (obrázek 1). Domnělé obtíže při přiřazování sekvencí genů rRNA k taxonům způsobené nemožností přesného zarovnání sekvencí lze do značné míry překonat pomocí metod bez zarovnání . Délkové rozdíly v kódujících oblastech rRNA však mohou potenciálně způsobit rozdíly v obnově sekvence specifické pro daný taxon. Je také pravda, že snazší zarovnání proteinových genů umožňuje opravit některé sekvenační chyby . Důležité je, že při každé aplikaci metabarcodingu je třeba pečlivě zvážit řadu potenciálních primerů a taxonomické rozlišení výsledných amplikonů. Primery lze snadno vyhodnotit in silico pomocí dostupných programů (např. ecoPCR ); empirické testování poskytuje další jistotu, že primery jsou vhodné pro konkrétní aplikaci .
Předpokládáme, že metabarcoding bude nakonec rutinně sekvenovat několik markerů čárového kódu z každého vzorku . Markery zaměřené na různé taxonomické úrovně mohou překonat kompromis mezi taxonomickou šíří a rozlišením. Markery poskytující srovnatelnou taxonomickou informaci mohou fungovat jako vnitřní kontroly; ty by byly užitečné zejména pro validaci v případech, kdy jsou potenciálním problémem neshody primerových šablon. Metabarcodingové přístupy založené na hromadném sekvenování obohacené mtDNA bez amplifikace byly ilustrovány ve studii proof of concept . Tato práce může naznačovat budoucnost, kdy budou primery PCR méně důležité; dosud nastíněné metody však vyžadují neporušené molekuly mtDNA a nebyly by použitelné, pokud je DNA vysoce fragmentovaná. Alternativní techniky obohacování markerů, které pracují s řadou šablon, jako jsou přístupy založené na zachycování sond, by mohly být vhodnější pro markery, které nejsou COI a obsahují konzervované cílové oblasti.
Uznáváme, že existují situace, kdy by COI mohl být v současné době upřednostňovanou možností jako metabarcodingový marker (např. když je taxonomický rozsah omezený a identifikace na úrovni druhu kritická, nebo když je zásadní stávající referenční databáze). Pokud budoucí techniky umožní méně zkreslené získávání COI ze směsí DNA, bude COI skutečně vhodný pro metabarcoding. I když budou přijaty alternativní markery, infrastruktura pro čárové kódování DNA vyvinutá CBOL bude mít pro tuto oblast zásadní význam. Taxonomicky ověřené voucherové vzorky a související extrakty DNA jsou neocenitelným zdrojem, který by mohl usnadnit vysoce výkonnou charakterizaci dalších markerů . Stejně přínosná je databáze CBOL s referenčními sekvencemi propojenými s voucherovými exempláři (včetně „neoficiálních“ sekvencí čárových kódů) a úsilí o propojení taxonomických metadat CBOL s veřejně přístupnými sekvencemi v GenBank. Jsme nadšeni vyhlídkou, že metabarcoding poskytne rychlejší a levnější metodu měření biologické rozmanitosti živočichů, ale výběr markerů je třeba důkladněji prověřit a pro zvýšení spolehlivosti je třeba rozšířit výběr dostupných markerů.
Dostupnost dat
Sekvence DNA získané z GenBank a použité pro konstrukci obrázků 1 a 2 jsou uloženy jako elektronická doplňková data.
Poděkování
Děkujeme kolegům za diskuse na toto téma. Děkujeme také třem recenzentům za poskytnutí kritických připomínek, které pomohly zlepšit rukopis.
Vyjádření o financování
B.D. a S.J. obdrželi provozní granty Australského antarktického vědeckého programu (projekty AAS 4014 a 4313).
Poznámky
- 1
Taberlet P, Coissac E, Hajibabaei M& Rieseberg LH. 2012Environmental DNA. Mol. Ecol. 21, 1789-1793. (doi:10.1111/j.1365-294X.2012.05542.x). Crossref, PubMed, ISI, Google Scholar
- 2
Yu DW, Ji Y, Emerson BC, Wang X, Ye C, Yang C& Ding Z. 2012Biodiversity soup: metabarcoding of arthropods for rapid biodiversity assessment and biomonitoring. Methods Ecol. Evol. 3, 613-623. (doi:10.1111/j.2041-210X.2012.00198.x). Crossref, ISI, Google Scholar
- 3
Ficetola GF, Coissac E, Zundel S, Riaz T, Shehzad W, Bessiere J, Taberlet P& Pompanon F. 2010An in silico approach for the evaluation of DNA barcodes. BMC Genomics 11, e434. (doi:10.1186/1471-2164-11-434). Crossref, PubMed, ISI, Google Scholar
- 4
Geller J, Meyer C, Parker M& Hawk H. 2013Redesign of PCR primers for mitochondrial cytochrome c oxidase subunit I for marine invertebrates and application in all-taxa biotic surveys. Mol. Ecol. Resour. 13, 851-861. (doi:10.1111/1755-0998.12138). Crossref, PubMed, ISI, Google Scholar
- 5
Klindworth A, Pruesse E, Schweer T, Peplies J, Quast C, Horn M& Glockner FO. 2013Vyhodnocení obecných primerů PCR genu 16S ribozomální RNA pro klasické studie diverzity a studie diverzity založené na sekvenování nové generace. Nucleic Acids Res. 41, e1. (doi:10.1093/nar/gks808). Crossref, PubMed, ISI, Google Scholar
- 6
Bru D, Martin-Laurent F& Philippot L. 2008Quantification of the detrimental effect of a single primer-template mismatch by real-time PCR using the 16S rRNA gene as an example. Appl. Environ. Microbiol. 74, 1660-1663. (doi:10.1128/aem.02403-07). Crossref, PubMed, ISI, Google Scholar
- 7
Schloss PD, Gevers D& Westcott SL. 2011Snížení vlivu artefaktů amplifikace PCR a sekvenování na studie založené na 16S rRNA. PLoS ONE 6, e27310. (doi:10.1371/journal.pone.0027310). Crossref, PubMed, ISI, Google Scholar
- 8
Clarke LJ, Soubrier J, Weyrich LS& Cooper A. In press.Environmental metabarcodes for insects: in silico PCR reveals potential for taxonomic bias. Mol. Ecol. Resour. (doi:10.1111/1755-0998.12265). ISI, Google Scholar
- 9
Ji Y, et al.2013Reliable, verifiable and efficient monitoring of biodiversity via metabarcoding. Ecol. Lett. 16, 1245-1257. (doi:10.1111/ele.12162). Crossref, PubMed, ISI, Google Scholar
- 10
De Barba M, Miquel C, Boyer F, Mercier C, Rioux D, Coissac E& Taberlet P. 2014DNA metabarcoding multiplexing and validation of data accuracy for diet assessment: application to omnivorous diet. Mol. Ecol. Resour. 14, 306-323. (doi:10.1111/1755-0998.12188). Crossref, PubMed, ISI, Google Scholar
- 11
Leray M, Yang JY, Meyer CP, Mills SC, Agudelo N, Ranwez V, Boehm JT& Machida RJ. 2013Nová univerzální sada primerů zaměřená na krátký fragment mitochondriální oblasti COI pro metabarcoding diverzity metazoí: použití pro charakterizaci obsahu střev ryb korálových útesů. Front. Zool. 10, e34. (doi:10.1186/1742-9994-10-34). Crossref, PubMed, ISI, Google Scholar
- 12
Little DP. 2011DNA barcode sequence identification incorporating taxonomic hierarchy and within taxon variability (Identifikace sekvence čárového kódu DNA zahrnující taxonomickou hierarchii a variabilitu v rámci taxonu). PLoS ONE 6, e20552. (doi:10.1371/journal.pone.0020552). Crossref, PubMed, ISI, Google Scholar
- 13
Deagle BE, Kirkwood R& Jarman SN. 2009Analýza stravy australských lachtanů pomocí pyrosekvenování DNA kořisti v trusu. Mol. Ecol. 18, 2022-2038. (doi:10.1111/j.1365-294X.2009.04158.x). Crossref, PubMed, ISI, Google Scholar
- 14
Zhou X, et al.2013Ultrahluboké sekvenování umožňuje vysoce věrné obnovení biodiverzity pro hromadné vzorky členovců bez amplifikace PCR. GigaScience 2, 4. (doi:10.1186/2047-217X-2-4). Crossref, PubMed, ISI, Google Scholar
- 15
Shokralla S, Gibson JF, Nikbakht H, Janzen DH, Hallwachs W& Hajibabaei M. 2014Next-generation DNA barcoding: using next-generation sequencing to enhance and accelerate DNA barcode capture from single specimens. Mol. Ecol. Resour. 14, 892-901. (doi:10.1111/1755-0998.12236). PubMed, ISI, Google Scholar
.