DNA metabarcoding e il marcatore della subunità I della citocromo c ossidasi: non una corrispondenza perfetta

Ago 23, 2021
admin

Introduzione

La disponibilità di sequenziamento del DNA ad alta produttività (HTS) a prezzi accessibili ha aperto un nuovo mondo di possibilità nelle indagini basate sul DNA della biodiversità. Questo approccio è più avanzato nel campo della microbiologia, dove la tassonomia molecolare ha una lunga tradizione, e le analisi ora usano regolarmente HTS per caratterizzare i marcatori per le stime della diversità tassonomica e funzionale. I geni “barcode” amplificati sono sempre più utilizzati anche per identificare piante, invertebrati e vertebrati presenti in miscele di DNA, ottenute estraendo il DNA totale da campioni in pool o da campioni ambientali (ad esempio suolo, acqua e feci). Questa caratterizzazione dei codici a barre del DNA da miscele di DNA è stata definita “metabarcoding”.

Oltre al requisito di dati di sequenza poco costosi e affidabili, il metabarcoding ha anche bisogno di un marcatore adatto. Per la codifica a barre standard del DNA di singoli esemplari animali, il Consortium for the Barcode of Life (CBOL) ha adottato il gene mitocondriale della citocromo c ossidasi subunità I (COI). Questo marcatore ha gli attributi richiesti: la sua variazione di solito permette la discriminazione a livello di specie, può essere amplificato tramite PCR dalla maggior parte degli animali e il database associato vanta ormai milioni di sequenze di DNA tassonomicamente verificate. Sembra la scelta ovvia del marcatore nel campo nascente del metabarcoding animale, ed è stato usato in molti studi recenti, comprese le applicazioni nelle indagini sulla biodiversità, il monitoraggio ambientale e gli studi sulla dieta (studi di esempio forniti nel materiale supplementare elettronico).

Cos’è che non va nella subunità I del citocromo c ossidasi come marcatore di metabarcoding?

Mentre COI può essere amplificato da un’enorme gamma di specie, è sempre stato riconosciuto che i siti di legame dei primer all’interno di questo gene codificante la proteina non sono altamente conservati. Le mutazioni in molte posizioni nucleotidiche non cambiano la proteina codificata (di solito l’ultima base della tripletta di codice) e sono meno vincolate dalla selezione. Di conseguenza, un gran numero di primer sono stati progettati per l’amplificazione di COI da vari gruppi animali (attualmente più di 400 primer COI nel database dei primer CBOL). Sono stati descritti anche primer “universali” che amplificano la regione del codice a barre COI, ma l’analisi in silico mostra che sono scarsamente conservati (figura 1). Studi empirici indicano che questa variabilità dei primer si traduce in un’amplificazione inaffidabile quando i campioni includono specie che coprono un’ampia gamma tassonomica (ad esempio il 44% di successo in più di 2000 amplificazioni iniziali; Moorea Biocode Project). Nella codifica a barre del DNA standard, è possibile ottimizzare i protocolli per ottenere dati da campioni che inizialmente non riescono ad amplificarsi. Tuttavia, quando si metabarcodifica una miscela di DNA, la mancata amplificazione di particolari taxa è mascherata dal recupero di ampliconi da altri taxa presenti nel campione. Questo rende difficile l’ottimizzazione del protocollo. Inoltre, il recupero di alcune sequenze attese dà una falsa fiducia nel set di dati risultante.

Figura 1.

Figura 1. Variabilità dei potenziali marcatori di metabarcoding in insetti rappresentativi (40 specie di 25 ordini diversi): (a) mtDNA COI (regione 5′), (b) mtDNA 16S (regione 5′), (c) mtDNA 12S e (d) nucleare 18S (regione 5′). I dati sono stati estratti dai set di dati mtDNA completi e dalle sequenze nucleari comparabili del gene 18S rRNA. L’entropia rappresenta una misura della variabilità in una data posizione e l’ombreggiatura nei siti di primer evidenziati mostra i quattro nucleotidi. I primer COI sono stati applicati in oltre una dozzina di studi di metabarcoding; vedi il materiale supplementare elettronico per i dettagli. (Versione online a colori.)

Molti studi di ecologia microbica hanno dimostrato che, sebbene i primer non corrispondenti siano in grado di amplificare il DNA di diversi genomi batterici, i bersagli senza perfetta omologia amplificano con un’efficienza inferiore e spesso imprevedibile. In alcuni casi, anche un mismatch di una singola base può produrre una sottostima di 1000 volte dell’abbondanza, rendendo alcuni batteri “quasi non rilevabili” nell’analisi HTS di comunità fittizie. L’uso di cocktail con diverse varianti di primer può aumentare i tassi di successo dell’amplificazione nella codifica standard del DNA, ma sulla base di recenti valutazioni questi non sono una panacea per la metabarcodifica COI. Ciò è probabilmente dovuto al fatto che i siti labili nelle regioni di legame dei primer COI divergono rapidamente (figura 2). Pertanto, il numero di primer richiesti per tenere conto della variabilità, anche tra taxa relativamente vicini, diventa rapidamente insostenibile. Inoltre, non tutte queste sequenze di primer saranno efficaci per amplificare il DNA (ulteriori discussioni nel materiale supplementare elettronico). Un problema separato per la progettazione dei primer COI metabarcode è che la variazione nei siti meno vincolati diventa satura tra taxa lontanamente imparentati come risultato dell’omoplasia (figura 2). Questo plateau nella divergenza delle sequenze ostacola lo sviluppo di primer specifici per un gruppo (ad esempio per tutti gli insetti ma escludendo altri artropodi terrestri).

Figura 2.

Figura 2. Variabilità nelle regioni di legame dei primer in due marcatori mtDNA (COI e 16S) a diversi livelli tassonomici. I siti di legame confrontati includono quelli per i primer comunemente usati per amplificare un marcatore COI full-length barcode, quelli per un primer interno COI metabarcoding e primer mtDNA 16S analoghi. I disallineamenti al di sotto del livello di classe sono per i confronti tra sequenze di pesci con pinne raggiate rappresentative (classe Actinopterygii); per i confronti tra classi sono stati considerati i Vertebrata rappresentativi (n = 155 sequenze; vedi il materiale elettronico supplementare per i dettagli).

Nonostante queste limitazioni, sono stati sviluppati diversi primer COI specificamente per la metabarcodifica. Per esempio, è stato pubblicato un certo numero di primer COI “mini-barcoding” per l’amplificazione di brevi frammenti recuperabili da template degradati, anche se i siti dei primer variano tra le specie bersaglio e marcatori alternativi sembrano più adatti (figura 1). I cocktail di primer per la metabarcoding sono stati progettati anche per amplificare l’intera regione di codifica a barre COI negli invertebrati marini, nonostante meno del 50% dei nucleotidi nei siti di legame siano conservati nei taxa target.

È meglio accettare le distorsioni e attenersi ai marcatori di codice a barre standard per la metabarcoding?

Si potrebbe sostenere che le distorsioni introdotte dal legame differenziale dei primer COI sono gestibili se sono coerenti tra i campioni da confrontare e il sequenziamento viene eseguito a una profondità sufficiente. Inoltre, questa potrebbe essere considerata una piccola concessione, dato che COI permette di accedere a un gran numero di sequenze di codici a barre legate a campioni tassonomicamente verificati. Tuttavia, riteniamo che anche i migliori studi di metabarcoding COI evidenziano i limiti di questo marcatore e indicano che le alternative dovrebbero essere seriamente considerate. Per esempio, il lavoro di Yu et al. sul sequenziamento in massa di COI da campioni di artropodi per l’analisi della biodiversità ha documentato tassi di abbandono compresi tra il 24% (soglia di più di 2 letture) e il 36% (soglia di più di 5 letture) rispetto agli input noti anche quando si usano primer completamente degenerati. Mentre i dati risultanti producono stime di α- e β-diversità utili per decisioni rilevanti per la conservazione, l’accettazione di questo livello di bias limiterà sicuramente le applicazioni future. La variazione nell’occorrenza di taxa inclini al dropout tra gruppi di campioni può potenzialmente distorcere l’importanza relativa di tutti i taxa, rendendo difficile valutare le differenze biologicamente rilevanti tra i gruppi.

Quando le valutazioni metodologiche preliminari non sono complete e le limitazioni del set di dati non sono prese in considerazione, l’interpretazione dei dati è irta di difficoltà. In un recente studio di valutazione dei marcatori di metabarcoding degli insetti, una serie di primer COI di metabarcoding per artropodi generici ampiamente utilizzati è riuscita a recuperare solo tra il 43 e il 64% delle specie in una miscela nota di DNA di artropodi. La valutazione retrospettiva di studi ecologici basati su dati prodotti da questi primer è difficile; tuttavia, in alcuni casi le preferenze dei primer piuttosto che la biologia possono guidare le conclusioni.

E’ improbabile che l’aumento della profondità di sequenziamento per consentire il rilevamento di marcatori scarsamente amplificati sia una soluzione robusta, perché ci sarà un aumento concomitante del numero di sequenze provenienti da contaminazioni minori e molecole chimeriche. I metodi utilizzati per filtrare questi errori di fondo di basso livello e identificare le sequenze rare legittime sono imperfetti. Inoltre, l’incorporazione degli errori di basso livello nei set di dati di metabarcoding può avere un’influenza sproporzionata perché i sommari sono tipicamente basati sull’incidenza (cioè presenza/assenza) e non includono informazioni sull’abbondanza delle sequenze.

Nonostante l’ampio database di riferimento COI sia un forte punto di vendita per questo marcatore, molti studi di metabarcoding COI collegano le sequenze recuperate alle unità tassonomiche operative (OTU) piuttosto che fornire informazioni tassonomiche ad alta risoluzione. Questo riflette in parte l’adozione di approcci bioinformatici da parte degli ecologi microbici, ma anche la mancanza di copertura all’interno del database globale COI. La grande collezione di sequenze di riferimento COI può aiutare a migliorare le assegnazioni tassonomiche di massima (cioè alla famiglia o al genere), ma in molti studi saranno necessari database sviluppati localmente se l’intenzione è quella di allontanarsi dagli indicatori OTU e tornare alla biologia. Questo apre la possibilità di sequenziare marcatori di codici a barre non standard più adatti alla metabarcodifica, se ritenuto opportuno. La flessibilità in quale marcatore viene utilizzato per la metabarcodifica è una necessità per alcuni gruppi animali, come i nematodi, dove si riconosce che COI è inadatto a causa della diversità di sequenza. Ci sono anche problemi simili per i codici a barre “ufficiali” delle piante, con il risultato che molti studi di metabarcoding delle piante scelgono marcatori “non ufficiali”.

Qual è la strada da seguire?

L’accuratezza della metabarcoding dipende molto dalla scelta del marcatore, ma purtroppo non esiste un marcatore di metabarcoding perfetto. Invece, la migliore scelta del marcatore sarà specifica per lo studio. Per la progettazione di primer altamente conservati, il modello a mosaico di variazione visto nei geni dell’RNA ribosomiale (rRNA) è spesso molto utile (figura 1). Questi geni sono già stati adottati da molti nella comunità di metabarcoding animale e sono marcatori standard per l’identificazione di funghi e batteri/archeti. Per gli animali, i geni rRNA nucleari forniscono una copertura tassonomica molto ampia ma una risoluzione tassonomica inferiore, mentre i geni rRNA mitocondriali forniscono una risoluzione tassonomica simile a COI ma tipicamente permettono la progettazione di primer più conservati (figura 1). Le difficoltà percepite nell’assegnare le sequenze del gene dell’rRNA ai taxa causate dall’incapacità di allineare accuratamente le sequenze possono essere ampiamente superate utilizzando metodi senza allineamento. Tuttavia, la variazione di lunghezza nelle regioni codificanti dell’rRNA può potenzialmente causare differenze specifiche del taxon nel recupero della sequenza. È anche vero che un allineamento più facile dei geni proteici permette di correggere alcuni errori di sequenziamento. Il punto importante è che una gamma di potenziali primer, e la risoluzione tassonomica degli ampliconi risultanti, dovrebbe essere attentamente considerata in qualsiasi applicazione di metabarcoding. I primer possono essere facilmente valutati in silico utilizzando programmi disponibili (ad esempio ecoPCR ); test empirici forniscono ulteriori garanzie che i primer sono adatti per una particolare applicazione.

Prevediamo che il metabarcoding alla fine sequenzierà abitualmente diversi marcatori di codici a barre da ogni campione. I marcatori mirati a diversi livelli tassonomici possono superare il trade-off tra ampiezza tassonomica e risoluzione. I marcatori che forniscono informazioni tassonomiche comparabili possono agire come controlli interni; questi sarebbero particolarmente utili per la convalida nei casi in cui gli errori del primer-template sono un potenziale problema. Gli approcci di metabarcoding che si basano sul sequenziamento in massa del mtDNA arricchito senza amplificazione sono stati illustrati in uno studio di prova del concetto. Questo lavoro potrebbe indicare un futuro in cui i primer PCR sono meno rilevanti; tuttavia, i metodi delineati finora richiedono molecole mtDNA intatte e non sarebbero applicabili quando il DNA è altamente frammentato. Tecniche alternative di arricchimento dei marcatori che lavorano con una gamma di modelli, come gli approcci basati sulla cattura della sonda, potrebbero essere più adatti ai marcatori non-COI che contengono regioni bersaglio conservate.

Riconosciamo che ci sono situazioni in cui COI potrebbe attualmente essere l’opzione preferita come marcatore di metabarcoding (ad esempio quando la portata tassonomica è limitata e l’identificazione a livello di specie critica, o quando il database di riferimento esistente è essenziale). In effetti, se le tecniche future permetteranno un recupero meno distorto di COI dalle miscele di DNA, COI sarebbe ben adatto alla metabarcodifica. Anche se vengono adottati marcatori alternativi, l’infrastruttura di DNA barcoding sviluppata da CBOL sarà vitale per questo campo. Gli esemplari di voucher tassonomicamente verificati, e gli estratti di DNA associati, sono una risorsa inestimabile che potrebbe facilitare la caratterizzazione high-throughput di ulteriori marcatori. Il database CBOL con sequenze di riferimento collegate ai campioni (incluse le sequenze di codici a barre “non ufficiali”), e gli sforzi per collegare i metadati tassonomici di CBOL alle sequenze pubblicamente accessibili in GenBank, sono altrettanto vantaggiosi. Siamo eccitati dalla prospettiva che il metabarcoding fornisca un metodo più veloce e meno costoso per misurare la biodiversità animale, ma la selezione dei marcatori ha bisogno di un maggiore controllo e le scelte dei marcatori disponibili devono essere ampliate per una migliore affidabilità.

Accessibilità dei dati

Le sequenze di DNA estratte da GenBank e utilizzate per la costruzione delle figure 1 e 2 sono depositate come dati supplementari elettronici.

Riconoscimenti

Ringraziamo i nostri colleghi per le discussioni su questo argomento. Ringraziamo anche i tre revisori per aver fornito commenti critici che hanno contribuito a migliorare il manoscritto.

Dichiarazione di finanziamento

B.D. e S.J. hanno ricevuto sovvenzioni operative dall’Australian Antarctic Science Program (AAS Projects 4014 e 4313).

Footnotes

© 2014 The Author(s) Published by the Royal Society. Tutti i diritti riservati.
  • 1
    Taberlet P, Coissac E, Hajibabaei M& Rieseberg LH. 2012DNA ambientale. Mol. Ecol. 21, 1789-1793. (doi:10.1111/j.1365-294X.2012.05542.x). Crossref, PubMed, ISI, Google Scholar
  • 2
    Yu DW, Ji Y, Emerson BC, Wang X, Ye C, Yang C& Ding Z. 2012Biodiversity soup: metabarcoding of arthropods for rapid biodiversity assessment and biomonitoring. Metodi Ecol. Evol. 3, 613-623. (doi:10.1111/j.2041-210X.2012.00198.x). Crossref, ISI, Google Scholar
  • 3
    Ficetola GF, Coissac E, Zundel S, Riaz T, Shehzad W, Bessiere J, Taberlet P& Pompanon F. 2010Un approccio in silico per la valutazione dei codici a barre DNA. BMC Genomics 11, e434. (doi:10.1186/1471-2164-11-434). Crossref, PubMed, ISI, Google Scholar
  • 4
    Geller J, Meyer C, Parker M& Hawk H. 2013Riprogettazione di primer PCR per la subunità I della citocromo c ossidasi mitocondriale per invertebrati marini e applicazione in indagini biotiche all-taxa. Mol. Ecol. Resour. 13, 851-861. (doi:10.1111/1755-0998.12138). Crossref, PubMed, ISI, Google Scholar
  • 5
    Klindworth A, Pruesse E, Schweer T, Peplies J, Quast C, Horn M& Glockner FO. 2013Valutazione dei primer PCR del gene 16S ribosomal RNA generale per studi di diversità classici e basati sul sequenziamento di prossima generazione. Nucleic Acids Res. 41, e1. (doi:10.1093/nar/gks808). Crossref, PubMed, ISI, Google Scholar
  • 6
    Bru D, Martin-Laurent F& Philippot L. 2008Quantificazione dell’effetto dannoso di un singolo mismatch primer-template tramite PCR in tempo reale usando il gene 16S rRNA come esempio. Appl. Environ. Microbiol. 74, 1660-1663. (doi:10.1128/aem.02403-07). Crossref, PubMed, ISI, Google Scholar
  • 7
    Schloss PD, Gevers D& Westcott SL. 2011Riduzione degli effetti dell’amplificazione PCR e degli artefatti di sequenziamento sugli studi basati su 16S rRNA. PLoS ONE 6, e27310. (doi:10.1371/journal.pone.0027310). Crossref, PubMed, ISI, Google Scholar
  • 8
    Clarke LJ, Soubrier J, Weyrich LS& Cooper A. In press.Environmental metabarcodes for insects: in silico PCR reveals potential for taxonomic bias. Mol. Ecol. Resour. (doi:10.1111/1755-0998.12265). ISI, Google Scholar
  • 9
    Ji Y, et al.2013Monitoraggio affidabile, verificabile ed efficiente della biodiversità tramite metabarcoding. Ecol. Lett. 16, 1245-1257. (doi:10.1111/ele.12162). Crossref, PubMed, ISI, Google Scholar
  • 10
    De Barba M, Miquel C, Boyer F, Mercier C, Rioux D, Coissac E& Taberlet P. 2014DNA metabarcoding multiplexing e validazione della precisione dei dati per la valutazione della dieta: applicazione alla dieta onnivora. Mol. Ecol. Resour. 14, 306-323. (doi:10.1111/1755-0998.12188). Crossref, PubMed, ISI, Google Scholar
  • 11
    Leray M, Yang JY, Meyer CP, Mills SC, Agudelo N, Ranwez V, Boehm JT& Machida RJ. 2013Un nuovo set di primer versatile che mira a un breve frammento della regione COI mitocondriale per la diversità metabarcoding metazoi: applicazione per la caratterizzazione dei contenuti intestinali dei pesci della barriera corallina. Front. Zool. 10, e34. (doi:10.1186/1742-9994-10-34). Crossref, PubMed, ISI, Google Scholar
  • 12
    Little DP. 2011Identificazione del codice a barre del DNA che incorpora la gerarchia tassonomica e la variabilità all’interno del taxon. PLoS ONE 6, e20552. (doi:10.1371/journal.pone.0020552). Crossref, PubMed, ISI, Google Scholar
  • 13
    Deagle BE, Kirkwood R& Jarman SN. 2009Analisi della dieta delle foche australiane da pyrosequencing DNA preda nelle feci. Mol. Ecol. 18, 2022-2038. (doi:10.1111/j.1365-294X.2009.04158.x). Crossref, PubMed, ISI, Google Scholar
  • 14
    Zhou X, et al.2013Ultra-deep sequencing consente il recupero ad alta fedeltà della biodiversità per campioni di artropodi in massa senza amplificazione PCR. GigaScience 2, 4. (doi:10.1186/2047-217X-2-4). Crossref, PubMed, ISI, Google Scholar
  • 15
    Shokralla S, Gibson JF, Nikbakht H, Janzen DH, Hallwachs W& Hajibabaei M. 2014Next-generation DNA barcoding: utilizzando il sequenziamento di nuova generazione per migliorare e accelerare la cattura del codice a barre del DNA da singoli esemplari. Mol. Ecol. Resour. 14, 892-901. (doi:10.1111/1755-0998.12236). PubMed, ISI, Google Scholar

Lascia un commento

Il tuo indirizzo email non sarà pubblicato.