DNA Metabarcoding and cytochrome c oxidase subunit I marker: not a perfect match

8月 23, 2021
admin

はじめに

ハイスループットのDNAシーケンス(HTS)が安価で可能になり、DNAベースの生物多様性に関する調査で新しい世界の可能性が開かれました。 このアプローチは、分子分類学が長い伝統を持つ微生物学の分野で最も進んでおり、現在では定期的にHTSを使用して、分類学的および機能的多様性を推定するためのマーカーを特徴付ける分析が行われている。 また、増幅された「バーコード」遺伝子は、プールされた標本や環境サンプル(土壌、水、糞便など)から全 DNA を抽出することによって得られる DNA 混合物中に存在する植物、無脊椎動物、脊椎動物の同定に用いられることが多くなってきている。 このように、DNA の混合物から DNA バーコードを特徴付けることは、「メタバーコーディング」と呼ばれています。

メタバーコーディングには、安価で信頼できる配列データが必要であることに加えて、適切なマーカーも必要です。 動物単一標本の標準的なDNAバーコーディングに、CBOL(Consortium for the Barcode of Life)はミトコンドリア・チトクロームc酸化酵素サブユニットI(COI)遺伝子を採用している。 このマーカーは、その変異が通常種レベルの識別を可能にし、ほとんどの動物からPCR増幅でき、関連するデータベースは現在、分類学的に検証された数百万のDNA配列を誇っているという、必要な特性を備えている。 このマーカーは、動物メタバーコーディングという新しい分野では当然の選択と思われ、生物多様性調査、環境モニタリング、食餌調査など、最近の多くの研究で使用されている(電子補足資料に研究例が掲載されている)。

So what is wrong with cytochrome c oxidase subunit I as a metabarcoding marker?

COI は非常に幅広い種から増幅できるが、このタンパク質コード化遺伝子内のプライマー結合部位が高度に保存されていないことは常に認識されてきた。 多くの塩基位置の変異は、コードされたタンパク質を変えず(通常はトリプレットコードの最後の塩基)、選択による制約を受けにくい。 従って、様々な動物群のCOIを増幅するためのプライマーが多数設計されている(現在、CBOLプライマーデータベースには400以上のCOIプライマーが登録されている)。 COIバーコード領域を増幅する「ユニバーサル」プライマーも報告されているが、in silico解析の結果、これらのプライマーは保存性が低いことが判明した(;図1)。 このようなプライマーの多様性は、広い分類学的範囲をカバーする種を含む試料では、信頼性の低い増幅をもたらすことが実証されている(例えば、2000以上の最初の増幅で44%の成功率;Moorea Biocode Project )。 標準的なDNAバーコーディングでは、最初に増幅できなかった標本からデータを得るために、プロトコルを最適化することが可能である。 しかし、DNA混合物をメタバーコードする場合、特定の分類群の増幅に失敗すると、サンプルに含まれる他の分類群からのアンプリコンが回復することによってマスクされる。 このため、プロトコルの最適化は困難である。 さらに、いくつかの予想される配列が回復することで、結果としてのデータセットに誤った信頼性がもたらされる。 代表的な昆虫(25目40種)におけるメタバーコードマーカー候補の多様性。 (a) mtDNA COI (5′領域), (b) mtDNA 16S (5′領域), (c) mtDNA 12S および (d) 核18S (5′領域)。 データはmtDNAの全データセットと比較可能な核18S rRNA遺伝子配列から抽出された。 エントロピーは与えられた位置での変動性の指標を表し、ハイライトされたプライマー部位の網掛けは4つのヌクレオチドを示す。 COIプライマーは10以上のメタバーコード研究に適用されている。詳細は電子補足資料を参照。 (オンライン版はカラー)

多くの微生物生態学研究により、ミスマッチプライマーは多様な細菌ゲノムからDNAを増幅することができるが、完全相同性のない標的は低い、しばしば予測できない効率で増幅することが示されてきた。 場合によっては、1塩基のミスマッチでさえも存在量を1000倍も過小評価してしまい、模擬群集のHTS分析において「ほとんど検出できない」細菌が存在することもある。 いくつかのプライマーを組み合わせたカクテルを使用すると、標準的なDNAバーコーディングの増幅成功率を高めることができるが、最近の評価では、これらはCOIメタバーコーディングの万能薬ではない。 これは、COIプライマー結合領域の脆弱な部位がすぐに分岐してしまうためと考えられる(図2)。 そのため、比較的近縁の分類群間であっても、ばらつきを考慮したプライマーの数がすぐに足りなくなる。 さらに、これらのプライマー配列のすべてがDNAの増幅に有効であるとは限らない(詳細は電子補足資料に記載)。 COIメタバーコードプライマー設計における別の問題として、制約の少ない部位の変異は、ホモプラシーの結果、遠縁の分類群間で飽和状態になることが挙げられる(図2)。 この配列分岐のプラトーが、グループ特異的プライマー(例えば、すべての昆虫を対象とするが、他の陸生節足動物を除く)の開発を妨げる。

図2.

図2. 2つのmtDNAマーカー(COIと16S)におけるプライマー結合領域の分類レベルの違いによる変動。 比較した結合部位は、全長COIバーコードマーカーの増幅によく使われるプライマー、内部COIメタバーコードプライマー、類似のmtDNA 16Sプライマーのものである。 クラスレベル以下のミスマッチは、代表的なエイ科魚類(Actinopterygii)の配列間の比較であり、クラス間の比較では、代表的な脊椎動物(n = 155配列、詳細は電子補足資料を参照)を考慮した。 例えば、プライマー部位が対象種によって異なり、代替マーカーがより適していると思われるにもかかわらず、分解したテンプレートから回収できる短い断片を増幅するためのCOI「ミニバーコード」プライマーが多数発表されている(図1)。 また、海産無脊椎動物のCOIバーコーディング領域を完全に増幅するプライマーカクテルも設計されているが、結合部位のヌクレオチドが対象分類群に保存されているのは50%未満である。

メタバーコーディングではバイアスを許容し標準バーコードマーカーに固執することが最善か

COIプライマーの結合性の違いにより生じるバイアスも比較対象の試料間で一定でシーケンスが十分深く行われれば対処可能であると言えるかもしれない。 さらに、COIによって分類学的に検証された標本にリンクされた多数のバーコード配列にアクセスできることを考えると、これは小さな譲歩と考えることができる。 しかし、最高のCOIメタバーコード研究でさえ、このマーカーの限界を浮き彫りにし、代替手段を真剣に検討すべきことを示していると感じている。 例えば、生物多様性解析のために節足動物のサンプルからCOIのバルクシーケンスを行ったYuらの研究では、完全に縮退したプライマーを使用した場合でも、既知の入力と比較して24%(2リード以上の閾値)から36%(5リード以上の閾値)のドロップアウト率を記録している。 この結果、α-およびβ-多様性の推定値が得られ、保全に関する意思決定に有用であるが、この程度のバイアスを許容することは、今後の応用を制限することは間違いないだろう。 また、脱落しやすい分類群の出現率にグループ間でばらつきがあると、すべての分類群の相対的な重要性に歪みが生じ、グループ間の生物学的な差異の評価が困難になる可能性がある

方法論の事前評価が包括的ではなく、データセットの制限も考慮されていないと、データの解釈には困難が伴う。 昆虫のメタバーコーディングマーカーを評価する最近の研究では、広く使用されている「一般節足動物」COIメタバーコーディングプライマーのセットは、節足動物DNAの既知の混合物から43~64%の種しか復元できなかった。 これらのプライマーから得られたデータに依存する生態学的研究のレトロスペクティブな評価は困難である。しかし、場合によっては、生物学よりもプライマーの好みが結論を左右することがある。

増幅度の低いマーカーを検出できるように配列深度を上げることは、マイナーな汚染やキメラ分子由来の配列数が同時に増加するため、確実な解決法とはならないであろう。 このような低レベルのバックグラウンドエラーを除去し、正当な希少配列を同定するための方法は不完全である。 さらに、メタバーコードデータセットへの低レベルエラーの組み込みは、サマリーが一般的に発生率ベース(すなわち、存在/不在)であり、配列存在量に関する情報を含まないため、不釣り合いな影響を与える可能性がある

COI マーカーの強いセールスポイントである大規模な COI 参照データベースにもかかわらず、多くの COI メタコーディング研究では、高解像度分類情報よりも、回収した配列をオペレーション分類単位 (OTU) にリンクしている … これは微生物生態学者によるバイオインフォマティクスアプローチの採用もあるが、グローバルなCOIデータベースの網羅性の低さも反映している。 COI参照配列の大規模なコレクションは、広範な分類学的割り当て(すなわち、科や属への割り当て)の改善に役立つかもしれませんが、多くの研究では、OTU指標から離れ、生物学に戻ることを意図する場合、ローカルに開発されたデータベースが必要になるでしょう。 このため、メタバーコードに適した非標準のバーコードマーカーを配列決定する可能性がある。 線虫のように、配列の多様性からCOIが適さない動物群では、メタバーコードに使用するマーカーを柔軟に選択することが必要である。 また、「公式」植物バーコードにも同様の問題があり、その結果、多くの植物メタバーコーディング研究では「非公式」マーカーを選択している。

メタバーコーディングの精度はマーカーの選択に大きく依存するが、残念ながら完璧なメタバーコーディングマーカーは存在しない。 むしろ、最適なマーカー選択は研究に特化したものになると思われます。 高度に保存されたプライマーを設計するためには、リボソームRNA(rRNA)遺伝子に見られるモザイク状の変異パターンがしばしば非常に有効である(図1)。 これらの遺伝子は、動物のメタバーコードコミュニティではすでに多く採用されており、真菌や細菌・古細菌の同定に標準的なマーカーとなっている。 一方、ミトコンドリアRNA遺伝子はCOIと同程度の分類学的解像度を持つが、より保存性の高いプライマーを設計することが可能である(図1)。 rRNA 遺伝子の配列が正確に整列できないために生じる分類群への割り当ての困難さは、整列不要の方法を用いることでほぼ克服することができる。 しかし、rRNAコード領域の長さのばらつきは、配列の回復に分類群固有の差異をもたらす可能性があります。 また、タンパク質遺伝子のアライメントを容易にすることで、配列の誤りをある程度修正することができることも事実である . 重要なのは、メタバーコードを行う際には、様々なプライマーの候補と、得られたアンプリコンの分類学的解像度を慎重に検討する必要があるということである。 プライマーは、入手可能なプログラム(例:ecoPCR )を使用して簡単にインシリコで評価することができる。経験的なテストにより、プライマーが特定のアプリケーションに適していることがさらに保証される。 異なる分類学的レベルを対象としたマーカーは、分類学的な広さと解像度の間のトレードオフを克服することができる。 プライマーとテンプレートのミスマッチが問題になりそうな場合は、特にバリデーションに有用である。 増幅を伴わない濃縮mtDNAのバルクシークエンシングに依存するメタバーコードアプローチは、概念実証研究において例示されている。 この研究は、PCRプライマーがあまり重要でなくなる未来を示すものかもしれない。しかし、これまでに概説された方法は、無傷のmtDNA分子を必要とし、DNAが高度に断片化されている場合には適用できないだろう。 プローブ捕獲ベースのアプローチなど、さまざまなテンプレートで動作する代替マーカーエンリッチメント技術は、保存された標的領域を含む非COIマーカーに適しているかもしれない。

我々は、メタバーコードマーカーとして現在COIが好ましい選択肢である状況(例えば、分類学の範囲が限られていて種レベルの識別が重要であったり、既存の参照データベースが不可欠である場合)もあり得ることを認識している。 実際、将来の技術でDNA混合物からCOIをあまり偏りなく回収できるようになれば、COIはメタバーコードに十分適している。 たとえ代替マーカーが採用されたとしても、CBOLが開発したDNAバーコーディングのインフラは、この分野では不可欠である。 分類学的に検証されたバウチャー標本とそれに付随するDNA抽出物は、追加マーカーのハイスループットな特性解析を促進する貴重なリソースである。 また、CBOLの分類学的メタデータをGenBankの一般にアクセス可能な配列にリンクさせる努力も同様に有益である。 メタバーコンは動物の生物多様性をより早く、より安価に測定できる方法として期待されているが、マーカーの選択にはもっと精査が必要で、信頼性を高めるために利用可能なマーカーの選択肢を広げる必要がある。

Data accessibility

GenBankから抽出し、図1と2の構築に使用したDNA配列は、電子補足データとして寄託されている。

謝辞

このテーマで議論した同僚に感謝します。 また、原稿の改善に役立つ批判的なコメントを提供してくれた3人の査読者に感謝する。

Funding statement

B.D. and S.J. received operating grants from the Australian Antarctic Science Program (AAS Projects 4014 and 4313).

脚注

© 2014 The Author(s) Published by the Royal Society.を参照されたし。 All rights reserved.
  • 1
    Taberlet P, Coissac E, Hajibabaei M& Rieseberg LH. 2012Environmental DNA. Mol. Ecol. 21, 1789-1793. (doi:10.1111/j.1365-294X.2012.05542.x). また、このような環境下での生物多様性保全は、生物多様性保全のための重要な課題である。 Methods Ecol. Evol. 3, 613-623. (doi:10.1111/j.2041-210X.2012.00198.x). Crossref, ISI, Google Scholar
  • 3
    Ficetola GF, Coissac E, Zundel S, Riaz T, Shehzad W, Bessiere J, Taberlet P& Pompanon F. 2010An in silico approach for evaluation of the DNA barcodes. BMC Genomics 11, e434. (doi:10.1186/1471-2164-11-434). また、このような研究成果を踏まえて、「日本人のDNAを用いた生物多様性保全のための研究」(日本生物多様性条約第10回締約国会議)を開催した。 Mol. Ecol. Resour. 13, 851-861. (doi:10.1111/1755-0998.12138). Crossref, PubMed, ISI, Google Scholar
  • 5
    Klindworth A, Pruesse E, Schweer T, Peplies J, Quast C, Horn M& Glockner FO. 2013Evaluation of general 16S ribosomal RNA gene PCR primers for classical and next-generation sequencing-based diversity studies(古典的および次世代シーケンシングに基づく多様性研究のための一般的な16SリボソームRNA遺伝子PCRプライマーの評価)。 Nucleic Acids Res.41、e1. (doi:10.1093/nar/gks808). Crossref, PubMed, ISI, Google Scholar
  • 6
    Bru D, Martin-Laurent F& Philippot L. 2008Quantification of the detrimental effect of a single primer-template mismatch by real-time PCR using the 16S rRNA gene as an example.16Sリボンを例として、プライマーとテンプレートのミスマッチによる有害な影響をリアルタイムPCRで定量化した。 Appl. Environ. Microbiol. 74, 1660-1663. (doi:10.1128/aem.02403-07). Crossref, PubMed, ISI, Google Scholar
  • 7
    Schloss PD, Gevers D& Westcott SL. 2011Reducing the effects of PCR amplification and sequencing artifacts on 16S rRNA-based studies(16SrRNAを用いた研究におけるPCR増幅と配列決定のアーチファクトの影響を軽減する)。 PLoS ONE 6, e27310. (doi:10.1371/journal.pone.0027310). Crossref, PubMed, ISI, Google Scholar
  • 8
    Clarke LJ, Soubrier J, Weyrich LS& Cooper A. In press.Environmental metabarcodes for insects: in silico PCR reveals potential for taxonomic bias.In press.Environmental metabarcodes for insects: in silico PCR reveal the potential for taxonomic bias.In silico PCR reveals potential for classification bias. Mol. Ecol. Resour. (doi:10.1111/1755-0998.12265). ISI, Google Scholar
  • 9
    Ji Y, et al.2013Reliable, verifiable and efficient monitoring of biodiversity via metabarcoding.ISI, Google Scholar
  • 9
    Ji Y, et al. Ecol. Lett. 16, 1245-1257. (doi:10.1111/ele.12162). Crossref, PubMed, ISI, Google Scholar
  • 10
    De Barba M, Miquel C, Boyer F, Mercier C, Rioux D, Coissac E& Taberlet P.2014DNA metabarcoding multiplexing and validation of data accuracy for diet assessment: application to omnivorous diet.「食の評価におけるDNA代謝マーカリングの多重化及びデータ精度の検証:雑食性食への適用」. Mol. Ecol. Resour. 14, 306-323. (doi:10.1111/1755-0998.12188). Crossref, PubMed, ISI, Google Scholar
  • 11
    Leray M, Yang JY, Meyer CP, Mills SC, Agudelo N, Ranwez V, Boehm JT& Machida RJ. 2013A new versatile primer set targeting a short fragment of the mitochondrial COI region for metabarcoding metazoan diversity: application for characterizing coral reef fish gut content.(メタゾアンの多様性をメタバーコードするためのミトコンドリアCOI領域の短いフラグメントをターゲットとした新しい汎用プライマーセット:サンゴ礁魚の腸内コンテンツの特性評価への応用 Front. Zool. 10, e34. (doi:10.1186/1742-9994-10-34). Crossref, PubMed, ISI, Google Scholar
  • 12
    Little DP. 2011分類学的階層と分類群内変動性を取り入れたDNAバーコード配列の同定。 PLoS ONE 6, e20552. (doi:10.1371/journal.pone.0020552). Crossref, PubMed, ISI, Google Scholar
  • 13
    Deagle BE, Kirkwood R& Jarman SN. 2009年パイロシークエンスによるオーストラリアオットセイの食性解析。 Mol. Ecol. 18, 2022-2038. (doi:10.1111/j.1365-294X.2009.04158.x). Crossref, PubMed, ISI, Google Scholar
  • 14
    Zhou X, et al.2013Ultra-deep sequencing enables high-fidelity recovery of avian for bulk arthropod samples without PCR amplification.超深度シークエンスにより、節足動物サンプルの生物多様性をPCR増幅せずに回復できる。 GigaScience 2, 4. (doi:10.1186/2047-217X-2-4). Crossref, PubMed, ISI, Google Scholar
  • 15
    Shokralla S, Gibson JF, Nikbakht H, Janzen DH, Hallwachs W& Hajibabaei M. 2014Next-generation DNA barcoding: using next-generation sequencing to enhance and accelerate DNA barcode capture from single specimens.次世代シーケンサーを使った標本からのDNAバーコードキャプチャー。 Mol. Ecol. Resour. 14, 892-901. (doi:10.1111/1755-0998.12236). PubMed, ISI, Google Scholar

.

コメントを残す

メールアドレスが公開されることはありません。