Metabarcodarea ADN și markerul de subunitate I a citocrom c oxidazei: nu este o potrivire perfectă
Introducere
Disponibilitatea secvențierii ADN de mare capacitate (HTS) la prețuri accesibile a deschis o nouă lume de posibilități în studiile biodiversității bazate pe ADN. Această abordare este cea mai avansată în domeniul microbiologiei, unde taxonomia moleculară are o tradiție îndelungată, iar analizele folosesc acum în mod regulat HTS pentru a caracteriza markerii pentru estimări ale diversității taxonomice, precum și funcționale. Genele „codurilor de bare” amplificate sunt, de asemenea, din ce în ce mai des utilizate pentru a identifica plantele, nevertebratele și vertebratele prezente în amestecuri de ADN – obținute fie prin extragerea ADN-ului total din specimene grupate, fie din probe de mediu (de exemplu, sol, apă și fecale). Această caracterizare a codurilor de bare de ADN din amestecuri de ADN a fost denumită „metabarcodare” .
Pe lângă cerința unor date de secvență ieftine și fiabile, metabarcodarea are nevoie și de un marker adecvat. Pentru codul de bare ADN standard al specimenelor de animale unice, Consortium for the Barcode of Life (CBOL) a adoptat gena mitocondrială a subunității I (COI) a citocromului c oxidazei mitocondriale. Acest marker are atributele necesare: variația sa permite de obicei o discriminare la nivel de specie, poate fi amplificată prin PCR de la majoritatea animalelor, iar baza de date asociată se mândrește în prezent cu milioane de secvențe de ADN verificate din punct de vedere taxonomic. Pare a fi alegerea evidentă a markerului în domeniul nou-înființat al metabarcodării animalelor și a fost utilizat în multe studii recente, inclusiv aplicații în anchete privind biodiversitatea, monitorizarea mediului și studii dietetice (exemple de studii furnizate în materialul electronic suplimentar).
Atunci ce este în neregulă cu subunitatea I a citocromului c oxidază I ca marker de metabarcodare?
În timp ce COI poate fi amplificată de la o gamă enormă de specii, a fost întotdeauna recunoscut faptul că locurile de legare a amorselor din cadrul acestei gene codificatoare de proteine nu sunt foarte conservate. Mutațiile în multe poziții de nucleotide nu modifică proteina codificată (de obicei, ultima bază a tripletului de cod) și sunt mai puțin constrânse de selecție. În consecință, a fost proiectat un număr mare de amorse pentru amplificarea COI din diferite grupuri de animale (în prezent, peste 400 de amorse COI în baza de date de amorse CBOL). Au fost, de asemenea, descriși amorsere „universale” care amplifică regiunea codului de bare COI, dar analiza in silico arată că acestea sunt slab conservate (; figura 1). Studiile empirice indică faptul că această variabilitate a amorselor duce la o amplificare nesigură atunci când eșantioanele includ specii care acoperă o gamă taxonomică largă (de exemplu, un succes de 44 % în mai mult de 2000 de amplificări inițiale; Moorea Biocode Project ). În cazul codului de bare standard de ADN, este posibil să se optimizeze protocoalele pentru a obține date de la specimene care inițial nu reușesc să se amplifice. Cu toate acestea, în cazul metabarcodării unui amestec de ADN, eșecul amplificării anumitor taxoni este mascat de recuperarea ampliconilor de la alți taxoni prezenți în eșantion. Acest lucru face ca optimizarea protocolului să fie dificilă. În plus, recuperarea unor secvențe așteptate conferă o încredere falsă în setul de date rezultat.
Multe studii de ecologie microbiană au arătat că, deși amorsele nepotrivite sunt capabile să amplifice ADN din genomuri bacteriene diverse, țintele fără omologie perfectă se amplifică cu o eficiență mai mică și adesea imprevizibilă . În unele cazuri, chiar și o singură bază nepotrivită poate produce o subestimare de 1000 de ori a abundenței , ceea ce face ca unele bacterii să fie „aproape nedetectabile” în analiza HTS a comunităților simulate . Utilizarea cocktailurilor cu mai multe variante de amorsă poate crește ratele de succes ale amplificării în cazul codului de bare standard de ADN , dar, pe baza evaluărilor recente, acestea nu reprezintă un panaceu pentru metabarcodarea COI . Acest lucru se datorează probabil faptului că situsurile labile din regiunile de legare a amorselor COI diferă rapid (figura 2). Prin urmare, numărul de amorse necesare pentru a lua în considerare variabilitatea, chiar și între taxoni relativ apropiați, devine rapid nesustenabil. În plus, nu toate aceste secvențe de amorsă vor fi eficiente la amplificarea ADN-ului (discuții suplimentare în materialul electronic suplimentar). O problemă distinctă pentru proiectarea amorselor metabarcode COI este aceea că variația la situsurile mai puțin constrânse devine saturată între taxoni înrudiți la distanță ca urmare a homoplastiei (figura 2). Acest platou în divergența secvențelor împiedică dezvoltarea de amorse specifice unui grup (de exemplu, vizând toate insectele, dar excluzând alte artropode terestre).
În ciuda acestor limitări, mai multe seturi de primer COI au fost dezvoltate special pentru metabarcodare. De exemplu, au fost publicați mai mulți amorse de „mini-barcodare” COI pentru amplificarea fragmentelor scurte recuperabile din șablonul degradat, chiar dacă locurile de amorsare variază în funcție de speciile țintă și markerii alternativi par a fi mai potriviți (figura 1). Au fost concepute, de asemenea, cocktailuri de amorsă de metabarcodare pentru a amplifica întreaga regiune de cod de bare COI la nevertebratele marine, în ciuda faptului că mai puțin de 50 % din nucleotidele de la situsurile de legare sunt conservate în taxonul vizat.
Este mai bine să acceptăm prejudecățile și să rămânem la markerii standard de cod de bare pentru metabarcodare?
S-ar putea argumenta că prejudecățile introduse de legarea diferențiată a amorselor COI pot fi gestionate dacă acestea sunt consecvente între eșantioanele care sunt comparate și dacă secvențierea este efectuată la o adâncime suficientă. În plus, aceasta ar putea fi considerată o mică concesie, având în vedere că COI permite accesul la un număr mare de secvențe de coduri de bare legate de specimene verificate din punct de vedere taxonomic. Cu toate acestea, considerăm că până și cele mai bune studii de metabarcodare COI evidențiază limitele acestui marker și indică faptul că ar trebui luate în considerare în mod serios alternative. De exemplu, lucrarea lui Yu et al. privind secvențierea în masă a COI din eșantioane de artropode pentru analiza biodiversității a documentat rate de abandon cuprinse între 24 % (prag mai mare de 2 citiri) și 36 % (prag mai mare de 5 citiri) în comparație cu intrările cunoscute, chiar și atunci când se utilizează primeri complet degenerate. Deși datele rezultate produc estimări ale diversității α și β utile pentru deciziile relevante pentru conservare , acceptarea acestui nivel de distorsiune va limita cu siguranță aplicațiile viitoare. Variația apariției taxonilor predispuși la abandon între grupurile de eșantioane poate distorsiona potențial importanța relativă a tuturor taxonilor, ceea ce face dificilă evaluarea diferențelor relevante din punct de vedere biologic între grupuri.
Când evaluările metodologice preliminare nu sunt complete și nu se iau în considerare limitările setului de date, interpretarea datelor este plină de dificultăți. Într-un studiu recent de evaluare a markerilor de metabarcodare a insectelor , un set de primeri de metabarcodare COI pentru „artropode generice”, utilizat pe scară largă, a reușit să recupereze doar între 43 și 64% din speciile dintr-un amestec cunoscut de ADN de artropode. Evaluarea retrospectivă a studiilor ecologice care se bazează pe datele produse de acești primeri este dificilă; cu toate acestea, în unele cazuri, este posibil ca preferințele primerilor, mai degrabă decât biologia, să fie la baza concluziilor.
Creșterea adâncimii de secvențiere pentru a permite detectarea markerilor slab amplificați este puțin probabil să fie o soluție robustă, deoarece va exista o creștere concomitentă a numărului de secvențe provenite din contaminări minore și molecule chimerice . Metodele utilizate pentru a filtra aceste erori de fond de nivel scăzut și pentru a identifica secvențele rare legitime sunt imperfecte. În plus, încorporarea erorilor de nivel scăzut în seturile de date de metabarcodare poate avea o influență disproporționată, deoarece rezumatele sunt de obicei bazate pe incidență (adică prezență/absență) și nu includ informații privind abundența secvențelor.
În ciuda faptului că baza de date de referință COI de mari dimensiuni este un argument puternic de vânzare pentru acest marker, multe studii de metabarcodare COI leagă secvențele recuperate de unități taxonomice operaționale (OTU), mai degrabă decât să furnizeze informații taxonomice de înaltă rezoluție . Acest lucru reflectă parțial adoptarea abordărilor bioinformatice de către ecologiștii microbieni, dar reflectă, de asemenea, lipsa de acoperire în cadrul bazei de date globale COI. Colecția mare de secvențe de referință COI poate contribui la îmbunătățirea atribuirilor taxonomice largi (de exemplu, la familie sau gen), dar în multe studii vor fi necesare baze de date dezvoltate la nivel local dacă intenția este de a se îndepărta de indicatorii OTU și de a reveni la biologie . Acest lucru deschide posibilitatea de a secvenția markerii de coduri de bare non-standard, mai bine adaptați la metabarcodare, atunci când se consideră necesar. Flexibilitatea în ceea ce privește markerul utilizat pentru metabarcodare este o necesitate pentru unele grupuri de animale, cum ar fi nematodele, unde se recunoaște că COI nu este adecvat din cauza diversității secvențelor. Există, de asemenea, probleme similare pentru codurile de bare „oficiale” ale plantelor, ceea ce face ca multe studii de metabarcodare a plantelor să aleagă markeri „neoficiali”.
Care este calea de urmat?
Precizia metabarcodării depinde în mare măsură de alegerea markerului, dar, din păcate, nu există un marker de metabarcodare perfect. În schimb, cea mai bună alegere a markerilor va fi specifică fiecărui studiu. Pentru proiectarea de primeri foarte conservați, modelul mozaic de variație observat în genele ARN ribozomal (ARNr) este adesea foarte util (figura 1). Aceste gene au fost deja adoptate de mulți membri ai comunității de metabarcodare a animalelor și sunt markeri standard pentru identificarea fungică și bacteriană/arhaică. Pentru animale, genele de ARNr nuclear oferă o acoperire taxonomică foarte largă, dar o rezoluție taxonomică mai mică, în timp ce genele de ARNr mitocondrial oferă o rezoluție taxonomică similară cu cea a COI, dar permit, de obicei, proiectarea unor amorse mai conservate (figura 1). Dificultățile percepute în atribuirea secvențelor de gene ARNr la taxoni, cauzate de incapacitatea de a alinia cu precizie secvențele, pot fi depășite în mare măsură folosind metode fără aliniere . Cu toate acestea, variația de lungime în regiunile de codificare a ARNr poate provoca potențial diferențe specifice taxonului în ceea ce privește recuperarea secvențelor. De asemenea, este adevărat că o aliniere mai ușoară a genelor proteice permite corectarea unor erori de secvențiere . Ceea ce este important este faptul că o gamă de potențiali primeri și rezoluția taxonomică a ampliconilor rezultați ar trebui să fie luate în considerare cu atenție în orice aplicație de metabarcodare. Amorsatorii pot fi ușor evaluați in silico prin utilizarea programelor disponibile (de exemplu, ecoPCR ); testarea empirică oferă o garanție suplimentară că amorsatorii sunt adecvați pentru o anumită aplicație .
Avem în vedere că, în cele din urmă, metabarcodarea va secvenția în mod curent mai mulți markeri de coduri de bare din fiecare eșantion . Markerii care vizează diferite niveluri taxonomice pot depăși compromisul dintre amploarea taxonomică și rezoluție. Markerii care oferă informații taxonomice comparabile pot acționa ca și controale interne; aceștia ar fi deosebit de utili pentru validare în cazurile în care neconcordanțele dintre primer și șablon reprezintă o problemă potențială. Abordările de metabarcodare care se bazează pe secvențierea în masă a ADNmt îmbogățit fără amplificare au fost ilustrate într-un studiu de validare a conceptului . Această lucrare ar putea indica un viitor în care amorsele PCR sunt mai puțin relevante; cu toate acestea, metodele descrise până acum necesită molecule de ADNmt intacte și nu ar fi aplicabile în cazul în care ADN-ul este foarte fragmentat. Tehnicile alternative de îmbogățire a markerilor care funcționează cu o serie de șabloane, cum ar fi abordările bazate pe capturarea sondei, ar putea fi mai potrivite pentru markerii non-COI care conțin regiuni țintă conservate.
Recunoaștem că există situații în care COI ar putea fi în prezent opțiunea preferată ca marker de metabarcodare (de exemplu, atunci când domeniul de aplicare taxonomică este limitat și identificarea la nivel de specie este critică sau atunci când baza de date de referință existentă este esențială). Într-adevăr, în cazul în care tehnicile viitoare permit o recuperare mai puțin distorsionată a COI din amestecuri de ADN, COI ar fi foarte potrivită pentru metabarcodare. Chiar dacă se vor adopta markeri alternativi, infrastructura de coduri de bare ADN dezvoltată de CBOL va fi vitală pentru acest domeniu. Specimenele justificative verificate din punct de vedere taxonomic și extractele de ADN asociate reprezintă o resursă neprețuită care ar putea facilita caracterizarea cu randament ridicat a markerilor suplimentari . Baza de date CBOL cu secvențe de referință legate de exemplarele de probă (inclusiv secvențe de coduri de bare „neoficiale”) și eforturile de a lega metadatele taxonomice ale CBOL de secvențele accesibile publicului din GenBank sunt la fel de benefice. Suntem entuziasmați de perspectiva ca metabarcodarea să ofere o metodă mai rapidă și mai puțin costisitoare de măsurare a biodiversității animale, dar selecția markerilor trebuie examinată mai atent, iar opțiunile de markeri disponibile trebuie lărgite pentru o mai mare fiabilitate.
Accesibilitatea datelor
Secvențele de ADN extrase din GenBank și utilizate pentru construirea figurilor 1 și 2 sunt depuse ca date electronice suplimentare.
Recunoștințe
Le mulțumim colegilor noștri pentru discuțiile pe această temă. De asemenea, mulțumim celor trei recenzenți pentru comentariile critice care au contribuit la îmbunătățirea manuscrisului.
Declarație de finanțare
B.D. și S.J. au primit subvenții de funcționare de la Australian Antarctic Science Program (AAS Projects 4014 și 4313).
Notele de subsol
- 1
Taberlet P, Coissac E, Hajibabaei M& Rieseberg LH. 2012Environmental DNA. Mol. Ecol. 21, 1789-1793. (doi:10.1111/j.1365-294X.2012.05542.x). Crossref, PubMed, ISI, Google Scholar
- 2
Yu DW, Ji Y, Emerson BC, Wang X, Ye C, Yang C& Ding Z. 2012Biodiversity soup: metabarcoding of arthropods for rapid biodiversity assessment and biomonitoring. Methods Ecol. Evol. 3, 613-623. (doi:10.1111/j.2041-210X.2012.00198.x). Crossref, ISI, Google Scholar
- 3
Ficetola GF, Coissac E, Zundel S, Riaz T, Shehzad W, Bessiere J, Taberlet P& Pompanon F. 2010An in silico approach for the evaluation of DNA barcodes. BMC Genomics 11, e434. (doi:10.1186/1471-2164-11-434). Crossref, PubMed, ISI, Google Scholar
- 4
Geller J, Meyer C, Parker M& Hawk H. 2013Redesign of PCR primers for mitochondrial cytochrome c oxidase subunit I for marine invertebrates and application in all-taxa biotic surveys. Mol. Ecol. Resour. 13, 851-861. (doi:10.1111/1755-0998.12138). Crossref, PubMed, ISI, Google Scholar
- 5
Klindworth A, Pruesse E, Schweer T, Peplies J, Quast C, Horn M& Glockner FO. 2013Evaluarea primerilor PCR generali ai genei ARN ribosomal 16S pentru studii de diversitate clasice și bazate pe secvențierea de generație următoare. Nucleic Acids Res. 41, e1. (doi:10.1093/nar/gks808). Crossref, PubMed, ISI, Google Scholar
- 6
Bru D, Martin-Laurent F& Philippot L. 2008Quantification of the detrimental effect of a single primer-template mismatch by real-time PCR using the 16S rRNA gene as an example. Appl. Environ. Microbiol. 74, 1660-1663. (doi:10.1128/aem.02403-07). Crossref, PubMed, ISI, Google Scholar
- 7
Schloss PD, Gevers D& Westcott SL. 2011Reducerea efectelor amplificării PCR și a artefactelor de secvențiere asupra studiilor bazate pe ARNr 16S. PLoS ONE 6, e27310. (doi:10.1371/journal.pone.0027310). Crossref, PubMed, ISI, Google Scholar
- 8
Clarke LJ, Soubrier J, Weyrich LS& Cooper A. In press.Environmental metabarcodes for insects: in silico PCR reveals potential for taxonomic bias. Mol. Ecol. Resour. (doi:10.1111/1755-0998.12265). ISI, Google Scholar
- 9
Ji Y, et al.2013Reliable, verifiable and efficient monitoring of biodiversity via metabarcoding. Ecol. Lett. 16, 1245-1257. (doi:10.1111/ele.12162). Crossref, PubMed, ISI, Google Scholar
- 10
De Barba M, Miquel C, Boyer F, Mercier C, Rioux D, Coissac E& Taberlet P. 2014DNA metabarcoding multiplexing and validation of data accuracy for diet assessment: application to omnivorous diet. Mol. Ecol. Resour. 14, 306-323. (doi:10.1111/1755-0998.12188). Crossref, PubMed, ISI, Google Scholar
- 11
Leray M, Yang JY, Meyer CP, Mills SC, Agudelo N, Ranwez V, Boehm JT& Machida RJ. 2013Un nou set de amorsă versatilă care vizează un fragment scurt al regiunii COI mitocondriale pentru metabarcodarea diversității metazoarelor: aplicație pentru caracterizarea conținutului intestinal al peștilor din reciful de corali. Front. Zool. 10, e34. (doi:10.1186/1742-9994-10-34). Crossref, PubMed, ISI, Google Scholar
- 12
Little DP. 2011Identificarea secvenței de coduri de bare ADN care încorporează ierarhia taxonomică și variabilitatea în cadrul taxonului. PLoS ONE 6, e20552. (doi:10.1371/journal.pone.0020552). Crossref, PubMed, ISI, Google Scholar
- 13
Deagle BE, Kirkwood R& Jarman SN. 2009Analiza dietei focilor cu blană din Australia prin pirozecvențierea ADN-ului de pradă din fecale. Mol. Ecol. 18, 2022-2038. (doi:10.1111/j.1365-294X.2009.04158.x). Crossref, PubMed, ISI, Google Scholar
- 14
Zhou X, et al.2013Ultra-deep sequencing enables high-fidelity recovery of biodiversity for bulk arthropod samples without PCR amplification. GigaScience 2, 4. (doi:10.1186/2047-217X-2-4). Crossref, PubMed, ISI, Google Scholar
- 15
Shokralla S, Gibson JF, Nikbakht H, Janzen DH, Hallwachs W& Hajibabaei M. 2014Next-generation DNA barcoding: using next-generation sequencing to enhance and accelerate DNA barcode capture from single specimens. Mol. Ecol. Resour. 14, 892-901. (doi:10.1111/1755-0998.12236). PubMed, ISI, Google Scholar
.