DNA Metabarcoding and cytochrome c oxidase subunit I marker: not a perfect match
はじめに
ハイスループットのDNAシーケンス(HTS)が安価で可能になり、DNAベースの生物多様性に関する調査で新しい世界の可能性が開かれました。 このアプローチは、分子分類学が長い伝統を持つ微生物学の分野で最も進んでおり、現在では定期的にHTSを使用して、分類学的および機能的多様性を推定するためのマーカーを特徴付ける分析が行われている。 また、増幅された「バーコード」遺伝子は、プールされた標本や環境サンプル(土壌、水、糞便など)から全 DNA を抽出することによって得られる DNA 混合物中に存在する植物、無脊椎動物、脊椎動物の同定に用いられることが多くなってきている。 このように、DNA の混合物から DNA バーコードを特徴付けることは、「メタバーコーディング」と呼ばれています。
メタバーコーディングには、安価で信頼できる配列データが必要であることに加えて、適切なマーカーも必要です。 動物単一標本の標準的なDNAバーコーディングに、CBOL(Consortium for the Barcode of Life)はミトコンドリア・チトクロームc酸化酵素サブユニットI(COI)遺伝子を採用している。 このマーカーは、その変異が通常種レベルの識別を可能にし、ほとんどの動物からPCR増幅でき、関連するデータベースは現在、分類学的に検証された数百万のDNA配列を誇っているという、必要な特性を備えている。 このマーカーは、動物メタバーコーディングという新しい分野では当然の選択と思われ、生物多様性調査、環境モニタリング、食餌調査など、最近の多くの研究で使用されている(電子補足資料に研究例が掲載されている)。
So what is wrong with cytochrome c oxidase subunit I as a metabarcoding marker?
COI は非常に幅広い種から増幅できるが、このタンパク質コード化遺伝子内のプライマー結合部位が高度に保存されていないことは常に認識されてきた。 多くの塩基位置の変異は、コードされたタンパク質を変えず(通常はトリプレットコードの最後の塩基)、選択による制約を受けにくい。 従って、様々な動物群のCOIを増幅するためのプライマーが多数設計されている(現在、CBOLプライマーデータベースには400以上のCOIプライマーが登録されている)。 COIバーコード領域を増幅する「ユニバーサル」プライマーも報告されているが、in silico解析の結果、これらのプライマーは保存性が低いことが判明した(;図1)。 このようなプライマーの多様性は、広い分類学的範囲をカバーする種を含む試料では、信頼性の低い増幅をもたらすことが実証されている(例えば、2000以上の最初の増幅で44%の成功率;Moorea Biocode Project )。 標準的なDNAバーコーディングでは、最初に増幅できなかった標本からデータを得るために、プロトコルを最適化することが可能である。 しかし、DNA混合物をメタバーコードする場合、特定の分類群の増幅に失敗すると、サンプルに含まれる他の分類群からのアンプリコンが回復することによってマスクされる。 このため、プロトコルの最適化は困難である。 さらに、いくつかの予想される配列が回復することで、結果としてのデータセットに誤った信頼性がもたらされる。 代表的な昆虫(25目40種)におけるメタバーコードマーカー候補の多様性。 (a) mtDNA COI (5′領域), (b) mtDNA 16S (5′領域), (c) mtDNA 12S および (d) 核18S (5′領域)。 データはmtDNAの全データセットと比較可能な核18S rRNA遺伝子配列から抽出された。 エントロピーは与えられた位置での変動性の指標を表し、ハイライトされたプライマー部位の網掛けは4つのヌクレオチドを示す。 COIプライマーは10以上のメタバーコード研究に適用されている。詳細は電子補足資料を参照。 (オンライン版はカラー)
多くの微生物生態学研究により、ミスマッチプライマーは多様な細菌ゲノムからDNAを増幅することができるが、完全相同性のない標的は低い、しばしば予測できない効率で増幅することが示されてきた。 場合によっては、1塩基のミスマッチでさえも存在量を1000倍も過小評価してしまい、模擬群集のHTS分析において「ほとんど検出できない」細菌が存在することもある。 いくつかのプライマーを組み合わせたカクテルを使用すると、標準的なDNAバーコーディングの増幅成功率を高めることができるが、最近の評価では、これらはCOIメタバーコーディングの万能薬ではない。 これは、COIプライマー結合領域の脆弱な部位がすぐに分岐してしまうためと考えられる(図2)。 そのため、比較的近縁の分類群間であっても、ばらつきを考慮したプライマーの数がすぐに足りなくなる。 さらに、これらのプライマー配列のすべてがDNAの増幅に有効であるとは限らない(詳細は電子補足資料に記載)。 COIメタバーコードプライマー設計における別の問題として、制約の少ない部位の変異は、ホモプラシーの結果、遠縁の分類群間で飽和状態になることが挙げられる(図2)。 この配列分岐のプラトーが、グループ特異的プライマー(例えば、すべての昆虫を対象とするが、他の陸生節足動物を除く)の開発を妨げる。