PUPpy: サブストレインレベルの微生物検出と絶対定量のためのプライマー設計パイプライン

ジャーナル

ログイン

戻る

オープンアクセス

環境微生物学

研究論文

9 2024年7月

PUPpy: サブストレインレベルの微生物検出と絶対定量のためのプライマー設計パイプライン


https://journals.asm.org/doi/10.1128/msphere.00360-24

著者 Hans Ghezzi https://orcid.org/0000-0002-3165-1805, Yiyun M. Fan https://orcid.org/0000-0002-4614-665X, Katharine M. Ng https://orcid.org/0000-0003-3494-5697, Juan C. Burckhardt https://orcid.org/0000-0001-5885-1623, Deanna M. Pepin https://orcid.org/0000-0003-2341-1462, Xuan Lin https://orcid.org/0000-0002-4988-1668, Ryan M. Ziels https://orcid.org/0000-0003-3705-6078, Carolina Tropini https://orcid.org/0000-0002-7542-1577carolina.tropini@ubc.caAuthors Info & Affiliations

DOI: https://doi.org/10.1128/msphere.00360-24

引用

PDF/EPUB

ABSTRACT

微生物生態系の複雑さと多様性を解明するためには、微生物群集を高分解能かつ絶対定量で特徴づけることが極めて重要である。これは、微生物DNAの高選択的検出と絶対定量を可能にするPCRアッセイで達成できる。しかし、マイクロバイオーム研究におけるPCRの応用を妨げている大きな課題は、意図した標的のみを増幅する特異性の高いプライマーセットの設計である。ここでは、PUPpy(Phylogenetically Unique Primers in python)を紹介する。PUPpyは、微生物群に特異的なプライマーを設計するための完全自動化パイプラインである。PUPpyは、ユーザーフレンドリーなグラフィカルユーザーインターフェイス、または2つのシンプルなターミナルコマンドから実行でき、入力としてコミュニティメンバーのコーディング配列ファイルのみを必要とする。PUPpyが設計したプライマーは、個々の微生物の検出と、菌株レベル以下の定義されたコミュニティにおける絶対的な微生物量の定量を可能にする。PUPpyが設計したプライマーの性能を、2つの細菌群集をベンチマークとして実験的に評価した。各コミュニティは10個のメンバーで構成され、異なる系統から亜系統に及ぶ遺伝的類似性の範囲を示した。PUPpy設計プライマーは、複雑な便微生物叢サンプル中の腸内細菌ファミリーの検出のような、未定義のコミュニティ中の細菌群の検出も可能にする。PUPpyを用いて設計された分類群特異的プライマーは、試験した各コミュニティにおいて、意図しない増幅を起こすことなく、意図したターゲットに対して100%の特異性を示した。最後に、PUPpyで設計したプライマーを用いた液滴デジタルPCRにおける微生物量の絶対定量を、16S rRNAおよびショットガンシーケンスと比較しながら示す。このデータから、PUPpy設計の微生物特異的プライマーを用いて亜系統レベルの絶対数を定量することができ、ショートリード16S rRNAやショットガンシーケンスよりも、定義されたコミュニティにおいてより分解能の高い正確な定量が可能であることが示された。

重要性

微生物生態系における隠れた生態学的相互作用を明らかにするためには、微生物群集を高分解能かつ絶対定量でプロファイリングすることが不可欠である。しかしながら、高分解能かつ定量的な調査の実現は、高度に近縁な微生物の区別と定量化における方法論的限界のために、これまで困難であった。ここでは、定義された微生物群集内で分類群特異的プライマーを設計するための自動計算パイプラインであるPhylogenically Unique Primers in python (PUPpy)について述べる。分類群特異的プライマーは、微生物群集内の個々の微生物やより大きな分類群を選択的に検出・定量するために使用できる。PUPpyは、計算集約的なデータベースを必要とすることなく、亜系統レベルの特異性を達成し、ターミナルとグラフィカルユーザーインターフェースの両方のアプリケーションを可能にすることで、使いやすさを優先している。全体として、PUPpyは、微生物生態系への高速で安価かつ高精度な視点を可能にし、試験管内および複雑な微生物叢設定の両方における細菌群集の特性解析をサポートします。

はじめに

微生物群集は、栄養循環、疾病の発生、炭素固定など、地球上の生命の数多くの側面において重要な役割を果たしている(1,2)。これらのプロセスは、関連性のない系統から近縁種まで、様々な分類学的レベルにまたがる驚くべき遺伝的・機能的多様性によって推進されている。機能的多様性は、近縁でない微生物の間で最も高いが、近縁の遺伝構成を持つ微生物にも存在する。重要なことは、菌株レベルでの微妙な遺伝的変異が、微生物代謝の変化(5-7)、免疫調節(8,9)、抗生物質耐性(10,11)、バイオフィルム形成(12)、病原体形成(13)など、広範な表現型の違い(3,4)につながる可能性があることである。例えば、大腸菌の種類によってヒトの健康への影響は大きく異なる: 大腸菌Nissle 1917は常在性(14)と考えられているが、腸管出血性大腸菌(EHEC)O157:H7や腸管凝集性大腸菌(EAEC)O104:H4(15)は病原性である。このように、分類学的な解像度が低い場合には見逃されがちな隠れた生態学的相互作用を明らかにするためには、少なくとも菌株レベルの粒度で微生物群集をプロファイリングすることが不可欠である。しかし、近縁の微生物を検出し定量化することは、遺伝子の構成がほとんど区別できないため、依然として困難な課題であり、微生物プロファイリングは多くの場合、分類学的解像度の低いレベルに限定される。
この10年間で、培養に依存したアプローチと独立したアプローチの両方が進歩し、微生物群集のハイスループットかつ高分解能な特性解析が可能になった。培養依存的手法の場合、制御された環境で細菌を増殖させることが飛躍的に進歩したため、混合群集から細菌株や細菌種を同定できるようになったが、これらの手法には多大な労力がかかるため、その普及には限界があった(16,17)。一方、培養に依存しない方法、特にアンプリコン(16S rRNAなど)やショットガンシーケンスは、希少で培養不可能な微生物も含め、コスト効率が高く、ハイスループットな微生物の検出と定量を可能にしている(18)。ショートリードとロングリードの両方の技術やプロファイリング法の進歩により、分類学的な解像度は著しく向上しているが、16S rRNAでは配列決定されたアンプリコンのばらつきが少ないため、ショットガンシーケンスよりも低いままである(19,20)。さらに、シーケンスデータから絶対量を推定するために、スパイクイン、セルカウント、DNA濃度など、いくつかのアプローチが採用されている(21,22)。これらの方法は推定値を提供するが、絶対量を正確に定量することは、存在する微生物ごとの微生物負荷の寄与を定量することの困難さ、植物または宿主DNAの汚染、抽出中のDNAの損失、シーケンスワークフローの複数のステップで異なるDNA断片に独自に影響する明確なバイアスなど、多くの要因のために本質的に困難な作業であることに変わりはない(21-23)。
粒状微生物の検出と絶対定量のためのもう一つの方法は、微生物特異的遺伝子を選択的に増幅することである。これは、定量的PCR(qPCR)や液滴デジタルPCR(ddPCR)など、広く利用可能なPCR技術によって実現できる(2425)。これらの方法はどこでも確立されており、コストと時間効率が高く、高感度であるため、かなりの計算資源や金銭的資源を必要とせず、解決された標的微生物調査を容易にする。さらに、PCRアッセイの感度は、希少なものを含む微生物集団の極めて正確な絶対定量を可能にする。とはいえ、あらゆる分類学的解像度(例えば、属、種、株レベル)で選択性の高いプライマーセットを設計することは、微生物調査におけるPCRアッセイの適用を妨げる大きな課題として残っている。これは、複雑で定義されていない微生物群集(例えば、糞便微生物群)を調査する場合に特に困難となる。一般的に、プライマー設計は16S rRNAアンプリコンやrpoB(26)、gyrB(27)、tuf(28)などのハウスキーピング遺伝子のような普遍的な系統学的マーカーを中心に行われてきた。しかし、これらの分子マーカーは、考慮されるアンプリコンのバリエーションが限られているため、近縁の微生物を検出する識別力に欠けることが多い。さらに最近では、シーケンシング技術の進歩により、微生物ゲノムのアセンブル数が飛躍的に増加したため、遺伝物質全体にわたってユニークな系統マーカーを設計することが可能になり、達成可能な解像度が向上した。
現在、SpeciesPrimer (29)、find_differential_primers (fdp)(30)、RUCS (31)、TOPSI (32)など、入力ゲノム配列に特異的なプライマーを設計するツールがいくつか存在する。しかし、これらのツールはすでに開発中止になっているか、設定ファイルを作成するのに多大な手作業が必要であるか、あるいはユーザーが定義した微生物の組み合わせに対して、微生物特異的プライマーとグループ特異的プライマーの両方を柔軟に設計することができない。もう一つの既発表のプライマー設計ツールセットはDECIPHER(33)で、in silicoPCRステップと連動したプライマー設計を含む、オリゴ設計のための多機能性を提供する。しかし、この機能はあらかじめアラインメントされたDNA配列をインプットとして必要とするため、プライマー設計プロセスを複雑にし、その効率を低下させる。これらの課題を総合すると、使いやすく、合理的で、ハイスループットかつ選択性の高い分類群特異的プライマー設計ツールの必要性が浮き彫りになる。
ここでは、PUPpy(Phylogenetically Unique Primers in python)を紹介する。PUPpyは、微生物群集内の個々の微生物または微生物群をターゲットとするプライマーを設計するための完全自動化パイプラインである。PUPpyは、サブストレインレベルの特異性を持つプライマーを設計するために、目的の微生物のコーディング配列(CDS)を入力として必要とするだけである。このパイプラインは、ターミナルまたは直感的なグラフィカルユーザーインターフェース(GUI)から実行できる2つのコマンドだけでプライマー設計を合理化する。PUPpyで設計されたプライマーを、遺伝的類似性の程度が異なる、異なる系統から亜系統までの10メンバーで構成される2つの定義された細菌群集に対してベンチマークした。また、PUPpyが設計したプライマーが、複雑で定義されていない従来のマウスの微生物叢において、非常に多様で潔癖な腸内細菌ファミリーであるMuribaculaceaeのメンバーを検出する能力を評価した。PUPpyで設計したすべての分類群特異的プライマーは、試験したすべての群集においてそれぞれの標的を選択的に増幅した。最後に、特定の群集における総微生物数を正確に定量するためのPUPpy設計プライマーの有効性を評価した。この評価はddPCRを用いて行い、16S rRNAやショットガンシーケンス法で得られた結果と比較した。我々のデータは、分類群特異的プライマーは、定義された微生物群集において、ショートリード16S rRNAやショットガンシーケンスよりも、より分解的で正確な定量を可能にすることを示唆している。全体として、PUPpyは、マイクロバイオーム研究で欠落していた必須パラメーターである個々の微生物分類群の絶対定量を可能にする直感的なツールである。PUPpyの多用途性により、環境研究から宿主関連微生物相研究に至るまで、定義されたコミュニティと複雑なコミュニティの両方を含む様々なアプリケーションに適している。

結果

PUPpyパイプラインの概要

PUPpyは、ユーザー定義の微生物群集をターゲットとする分類群特異的PCRプライマーの設計を可能にする、完全に自動化された計算パイプラインである(図1A)。このパイプラインは、分類群特異的プライマー設計の2つの主要な用途、すなわち微生物特異的プライマーと群特異的プライマーを定義している(図1B)。微生物特異的プライマーは、微生物群集の単一メンバーにのみ存在するユニークなCDSをターゲットとする。これらのプライマーは、完全な特異性で個々の分類群を標的とすることを可能にし、遺伝的類似性の高い群集における特定の微生物を追跡し定量する上で極めて重要な点である。逆に、グループ特異的プライマーは、ユーザーが定義したすべてのターゲットに共通する遺伝子を選択するように設計されている(図1B)。重要なのは、これらのプライマーによって、サンプル中の分類群全体(例えば、すべてのバクテロイデス)の微生物動態を選択的に評価できることである。微生物特異的なアプリケーションでもグループ特異的なアプリケーションでも、PUPpyはコミュニティ内のすべてのCDSをアライメントし、ユニーク(微生物特異的)または共有(グループ特異的)遺伝子を同定することによって、分類群特異的なプライマーを設計する。PUPpyは入力としてCDSファイルのみを必要とするので、ほとんどの場合ローカルで実行でき、メモリ集約的なデータベース(例えばNCBI nrデータベース)を必要としない。計算ワークフローの詳細は、Materials and methodsのセクションに記載されている。マイクロバイオーム研究におけるPUPpyの適用性を実証するために、複雑さを増す3つの微生物群集で分類群特異的プライマーを経験的に検証した。これらのコミュニティは、(i)系統学的に異なる10菌からなる定義されたコミュニティ、(ii)3つの近縁な分類群からなる10菌からなる定義されたコミュニティ、(iii)従来のマウスの糞便サンプルから得られた複雑な微生物叢で構成された。コミュニティの遺伝的類似性と複雑性を徐々に高めることで、多様な微生物群集シナリオにおけるパイプラインの分解能の限界と有効性を評価することができた。

図1

図1PUPpyパイプラインは、定義された微生物群集における分類群特異的プライマーを設計する。(A)PUPpyワークフローの概要。プライマーのターゲットと非ターゲット(バックグラウンド)の入力CDSファイルはMMseqs2 (34)を用いてアラインメントされる。Primer3(35)を用いて、それぞれ微生物特異的プライマーとグループ特異的プライマーを設計するために、候補となるユニーク遺伝子または共有遺伝子が選択される。(B)PUPpyの主要な出力は、微生物特異的プライマーとグループ特異的プライマーを含む分類群特異的プライマーである。微生物特異的プライマーは群集の個々のメンバーを選択的に標的とし、グループ特異的プライマーはユーザーが決めた微生物の集まりを標的とする。

微生物特異的プライマーは、遺伝的に多様なコミュニティーにおいて、意図された標的に対して特異性を示す。

最初のコミュニティ(以下「GUTコミュニティ」と呼ぶ)は、9科5門(Bacillota、Bacteroidota、Pseudomonadota、Actinomycetota、Verrucomicrobiota;表S1)に属する系統学的に異なる10種類の細菌から構成された。これらの細菌は系統学的に区別され、一般的な腸内常在菌であり、ヒトの腸内細菌叢の中で最も豊富な5つの門を代表するものとして選ばれた。この群集は単純ではあるが、いくつかのgnotobiotic動物モデル(36-38)に見られるような、定義された微生物コンソーシアムを正確に表している。特筆すべきことに、この群集の各メンバーは、かなりの数のユニークな遺伝子を有しており、以前にその特徴が明らかにされている(36,39,40)。GUTコミュニティー内の遺伝的多様性を確認するため、10菌のゲノムアセンブリーについて平均塩基同一性(ANI)を計算した(材料と方法を参照)。その結果、バクテロイデス属の2種、バクテロイデス・オバタス(Bacteroides ovatus)とバクテロイデス・テタイオタオミクロン(Bacteroides thetaiotaomicron)が、予想通り、同一性80%、カバー率50%という高い遺伝的類似性を示した(図2A)。他のGUTメンバーはすべて遺伝的多様性が大きく、同一性は75%未満、カバー率は8.5%未満であった(図2A)。ANI解析に続いて、デフォルトのパラメータでPUPpyを実行し、10種のGUTコミュニティメンバーすべてについて微生物特異的プライマーを作成した(表S2)。ANI解析で観察された遺伝的多様性の程度と一致して、PUPpyはより遺伝的に類似した生物において、より少ないユニークなCDSを同定した。PUPpyは見つかったユニークな遺伝子の数の多い順にプライマーターゲットを並べるので、コミュニティーの多様性を視覚的かつ定量的に即座に評価することができる(図2B)。特に、他のすべてのコミュニティメンバーと比較すると、PUPpyは、大腸菌BW25113では~74%であるのに対し、最も近縁な微生物であるB. ovatusでは~27%、B. thetaiotaomicronでは~26%のCDSをユニークなものとして同定した(図2B)。重要なことは、PUPpyは微生物特異的プライマーを設計するために、すべてのユニークなCDSを考慮し、同じCDSに複数のプライマーを設計できることである。したがって、最もユニークな遺伝子が少ないB. thetaiotaomicronでも、PUPpyはプライマー設計のために1,248のオプション(すなわち、約26%)を評価した(図2B)。次に、10人のGUTコミュニティメンバーから単離したゲノムDNA(gDNA)を用いたPCRとゲル電気泳動によって、GUT微生物特異的プライマーの特異性を経験的に検証した(材料と方法を参照)。各プライマー対は、(i)それぞれのgDNA陽性対照、(ii)10メンバーのgDNAプール、(iii)プライマー標的を除くすべての分類群を含む9メンバーのgDNAプール、(iv)テンプレートなし対照に対してテストされた(図2C)。この実験的検証の結果、すべての微生物特異的プライマーは、意図しない増幅を起こすことなく、それぞれのプライマー・ターゲットに特異的であることがわかった(図2D図S1)。したがって、PUPpyは微生物特異的プライマーを設計し、遺伝学的に多様で定義された微生物群集から個々の微生物を選択的に検出するために活用することができる。

図2

図2PUPpyで設計された微生物特異的プライマーは、系統学的に異なる10種類の細菌からなる群集中の微生物を選択的に検出する。(A) 10のGUTコミュニティメンバーの全ゲノム配列に基づくペアワイズANI(材料と方法)。色は同一性のパーセンテージを示し、赤が濃いほど配列間の類似性が高いことを示す。灰色の円は同一性のパーセンテージが70%未満であることを示す。円の大きさは配列間のアラインメントカバレッジを示し、ここでは2つのゲノムがアラインメントされた割合を示す。(B)PUPpyが生成したバープロットは、入力コミュニティの各メンバーについて同定されたユニークな遺伝子の数(菌株名の右側)を示す。B. thetaiotaomicronの1,248個(CDSの約26%)から大腸菌BW25113の3,269個(CDSの約74%)まで、GUTコミュニティメンバー全体で見つかったユニークな遺伝子の数が多いことは、ANI(A)で観察された遺伝的多様性を反映している。(C)GUTコミュニティーにおける微生物特異的プライマーの特異性を検証するための実験条件。PCRゲル画像は、Faecalibacterium prausnitziiについて上記の条件を用いて試験した微生物特異的プライマーの特異性を例証している。(D) (C)の検証後、各微生物特異的プライマーペアで増幅されたターゲットを示すバイナリーヒートマップ。各プライマーペアは、プライマーの最適化後、それぞれの意図したターゲット(対角線に沿った黒い四角)を独占的に増幅した。個々のゲルイメージングデータはFig.

分類群特異的プライマーは微生物を亜系統レベルまで選択的に検出する

微生物群集には同じ属内に複数の種や株が存在することが多いため、次にPUPpyを使って分類群特異的プライマーを設計し、関連性の高い微生物を検出できるかどうかを検討した。これを検証するために、10人の細菌からなる2番目のコミュニティを作成した(以下、「SSS(Species-Strain-Substrain)コミュニティ」と呼ぶ)(表S1)。この群集は、3種のEnterocloster、3種のB. thetaiotaomicron株、および4種の大腸菌K-12亜株で構成されていた。これらの細菌は、PUPpyで達成可能な分類学的解像度を評価すると同時に、分類群間の系統的多様性をある程度維持するために選ばれた。群集の遺伝的類似性を評価するため、ANI解析を行ったところ、SSS群集のメンバーは、割り当てられた分類学的分類に一致する3つの異なるメンバーにグループ分けされた(図3A)。予想通り、エンテロクロスター(Enterocloster)種は最も類似性が低く、最小の同一性は約78%、カバー率は約34%であった。逆に、近縁の大腸菌亜株は遺伝的に類似しており、99.95%以上の同一性と〜99%のカバレッジを共有していた(図3A)。次に、デフォルトのパラメータでPUPpyを実行し、各メンバーの微生物特異的プライマーと各分類群のグループ特異的プライマーの両方を設計した(表S2)。グループ特異的プライマーは、すべてのプライマーターゲット(例えば、すべてのEnterocloster種)で共有されるが、すべての意図しないターゲット(例えば、すべてのB. thetaiotaomicron株および大腸菌亜株)で欠損している遺伝子に設計され、微生物群集内の微生物分類群の選択的検出を可能にする。ANI解析および分類学的分類と一致して、PUPpyは検出されたユニークなCDSの数に基づいて、10人のメンバーを3つのグループに分類した(図3B)。具体的には、PUPpyは3つのEnterocloster種で約19%から約36%、B. thetaiotaomicron株で約7%から約17%、大腸菌K-12亜株で約0%から約1%のユニークなCDSを同定した(図3B)。デフォルトのパラメーターを使用した場合、PUPpyはSSSコミュニティ内で大腸菌MC4100に固有のCDSを同定しなかったため、この生物に特異的なプライマーは設計されず、テストも行われなかった(図3B)。ユニークな遺伝子がないのは、他の3つの大腸菌メンバー全てと遺伝的に近い類似性があるためと思われる。puppy-align "の同一性閾値のパーセンテージを上げることで、アライメントのストリンジェンシーを下げることができ、大腸菌MC4100のユニークな遺伝子が得られる可能性がある(詳細は材料と方法を参照)。GUTコミュニティと同じ実験デザインに従って、SSS微生物特異的プライマーの特異性を検証した(図3C)。さらに、グループ特異的プライマーの特異性を、(i)それぞれのプライマーgDNAターゲット、[条件(ii)は冗長な情報を提供するため実行しなかった]、(iii)ターゲット株gDNAを除くすべての分類群を含む9つのSSS gDNAプール、および(iv)テンプレートなしのコントロールに対して、それぞれのペアを実行することで検証した(図3C)。試験したすべての微生物およびグループ特異的プライマーは、分類学的レベルや遺伝的類似性とは無関係に、意図した標的に対して特異性を示した(図3CおよびD図S2)。これらのデータは、PUPpyがユニークなCDSに対するPCRプライマーを同定・設計することで、亜系統レベルまで微生物を選択的に検出できることを示している。さらに、この検証により、PUPpyが特定の細菌群間で保存されたCDSを同定する能力が明らかになり、単一のプライマー対で複数の生物を選択的に増幅できるようになった。

図3

図3PUPpyが設計した分類群特異的プライマーは、亜系統レベルまで微生物を選択的に検出する。(A) SSS群集の3つの近縁な分類群に属する10種類の微生物の全ゲノム配列に基づくペアワイズANI。色は同一性のパーセンテージを示し、赤が濃いほど配列間の類似性が高いことを示す。灰色の円は同一性のパーセンテージが70%未満であることを示す。円の大きさは配列間のアラインメントカバレッジを示し、ここでは2つのゲノムがアラインメントされた割合を示している。同一性のパーセンテージとカバレッジに基づいて遺伝的類似性を評価するANI解析では、Enterocloster種、B. thetaiotaomicron株、および大腸菌K-12亜株が、分類学的な割り当てと一致する3つの異なるクラスターとしてグループ化された。Enterocloster種は遺伝的類似性が低く、最小で78%の同一性と〜34%のカバレッジを示したが、大腸菌亜株は遺伝的にほぼ同一で、99.95%以上の同一性と〜99%のカバレッジを共有した。(B)PUPpyが生成したバープロット。SSSコミュニティーメンバーにおいてPUPpyによって同定されたユニークな遺伝子の数は、近縁の分類群が増えるにつれて減少する。エンテロクロスター種のCDSの19%から36%はSSSコミュニティー内でユニークであるが、大腸菌K-12のサブストレイン間でユニークなCDSは0%から1%に過ぎない。(C) SSS群集における微生物特異的プライマーとグループ特異的プライマーの特異性を検証するための実験条件。グループ特異的プライマーは、10メンバーのコミュニティ(すなわち実験条件ii)に対しては検証されなかった。(D)微生物特異的プライマー対とグループ特異的プライマー対の両方による選択的増幅をサブストレインレベルまで示したバイナリーヒートマップ。微生物特異的プライマー対は、大腸菌K-12 MC4100ではPUPpyがこの生物に固有の遺伝子を同定できなかったため、設計および検証できなかった。個々のゲルイメージングデータはFig. (E)従来のマウスの糞便サンプルから得られた複雑な微生物群集におけるムリバキュラ科特異的プライマーの特異性を検証するための実験条件。(F)5つのムリバクマメ科植物除去(ポリエチレングリコール(PEG)処理)(iii)および5つのムリバクマメ科植物陽性(未処理)(iv)の生物学的複製物の16S rRNA配列決定によるムリバクマメ科植物の定量。相対存在量はQIIME2(41)を用いて計算した(材料と方法のセクションを参照)。

グループ特異的プライマーが複雑な微生物群集のターゲットを選択的に検出

定義された微生物群集におけるPUPpy設計プライマーの特異性を検証した後、このパイプラインを、正確なメンバー構成が事前に分かっていない複雑な群集にも適用できるかどうかを検討した。このような環境で特定の分類群の存在を選択的に同定できるかどうかを調べるために、従来のマウス腸内細菌叢を利用した。マウスの腸内細菌叢には、多様性が高く培養が難しいムリバクラムシ科の細菌が多く、温血動物に広く生息している(42-44)。我々は以前、浸透圧性下剤であるポリエチレングリコール(PEG)を投与したマウスからムリバクラムシ科細菌が減少することを明らかにした(45)。未処理(ムリバキュラ科陽性)あるいはPEG処理(ムリバキュラ科欠乏;材料と方法を参照)したマウスの糞便サンプルからgDNAを抽出した。糞便gDNAサンプルの16S rRNAシークエンシングを行うことでムリバク科の有無を確認し、PUPpyが設計したムリバク科に対するプライマーを評価した。このような実験的検証は、特定のプライマーを設計する上で2つの主な課題を提示する。(i)群集の全体的な構成は事前に未知として扱われたため、PUPpyに入力するCDSファイルの完全なリストを持っていなかった。そこで、オフターゲット増幅の可能性を最小限にするため、156のノンターゲットと11の意図したムリバキュラ科のターゲットの包括的リストを選択した(表S1)。非標的は、Bacillota、Bacteroidota、Pseudomonadota、Actinomycetota、Verrucomicrobiota、Fusobacteriotaの各門を代表する腸内常在菌の中から選んだ。この167のメンバーからなるインプット・コミュニティーを使って、我々はムリバキュラ科の全メンバーに共有され、他の156のメンバーには存在しない遺伝子を同定することができた。重要なことは、ムリバキュラ科は非常に多様な科であるため(43)、この複雑なコミュニティにおける異なる亜分類群の高い潜在的代表性を考慮して、この遺伝子について8つのプライマー対を設計し、それらをプールしてムリバキュラ科特異的プライマーカクテルを作成したことである。このミックスを、ムリバキュラ症陽性およびムリバキュラ症欠乏の両方の糞便サンプルに対して検証し、その特異性を評価した(図3E;材料と方法を参照)。その結果、ムリバキュラ科特異的プライマーは、陽性サンプルではムリバキュラ科を選択的に検出したが、枯渇サンプルでは検出しなかった(図S3特異的であることに加え、これらのムリバキュラ科特異的プライマーは、未処理のサンプルではサイズの異なるPCRアンプリコンのオフターゲット増幅を示さなかった(Fig.) このことは、qPCRやddPCRのようなPCRアッセイにおいて、意図しない増幅によって定量に偏りが生じる可能性があるため、極めて重要である。以上より、PUPpyを用いることで、複雑な群集においても微生物の標的を選択的に増幅できる分類群特異的プライマーを設計することができる。

分類群特異的プライマーにより、微生物の高分解能絶対定量が可能になる

分類群特異的プライマーは、微生物の有無の検出だけでなく、qPCRやddPCRを用いた極めて高分解能での微生物絶対数の定量にも用いることができる(24,29)。PUPpyによる微生物定量を評価するため、PUPpy設計プライマーによるddPCRによる定量を、ショートリード16S rRNAおよびショットガンシーケンスと比較した。それぞれの微生物のgDNA濃度とゲノムサイズから算出した理論上のゲノムコピー比が1:1になるように、GUTおよびSSSコミュニティの各メンバーについて、それぞれ10個の抽出gDNAサンプルをプールした(材料と方法を参照)。次にgDNAプールを分注し、16S rRNAシーケンス、ショットガンシーケンス、およびPUPpyプライマーを用いたddPCRで解析した(図4A;材料と方法を参照)。ddPCRを用いて微生物の絶対量を算出し、それを組成データに変換して、シーケンス法で推定した相対量と比較した。GUTコミュニティでは、ddPCRとショットガンシーケンスは同程度の解像度を達成したが、後者の手法ではターゲットとするV3-V4領域の可変性が限られているため、予想通り16S rRNAシーケンスよりも著しく高かった(図4B)。特に、アンプリコンシークエンシングでは、4つのメンバー(Akkermansia muciniphila、Eubacterium rectale、B. ovatus、B. thetaiotaomicron)のみを種レベルで分類し、残りの6つのメンバーを属レベルで分類した(図4B)。逆に、ショットガンシークエンシングとddPCRの両方が、最大の分類学的解像度で10メンバーすべてを同定した。さらに、ddPCRでは、相対的な存在量よりも本質的に正確な絶対的な微生物数を測定することで、細菌組成をより定量的に評価することができた。

図4

図4PUPpyが設計した分類群特異的プライマーは、定義された群集において、16S rRNAやショットガンシーケンスよりも正確で分解能の高い定量を可能にした。(A)定量用サンプルを調製するワークフローの概略図(詳細は「材料と方法」のセクションを参照)。(BおよびC)GUT(B)およびSSS(C)群集におけるddPCR、16S rRNA、およびショットガンシークエンシングによる微生物定量を評価した積み上げ棒グラフ。ddPCRの絶対カウントは、他の方法とより直接的に比較するために相対存在量に変換した(材料および方法を参照)。

ddPCRでは、遺伝的に近縁なSSSメンバーにおいても正確で絶対的な定量が可能であった(図4C)。このアッセイでは、大腸菌K-12 MC4100を除くすべてのSSSコミュニティーメンバーについて、絶対数が選択的に検出・定量された。GUT 群集の結果と同様に、16S rRNA シークエンシングでは最も分解能が低く、3つの主要な分類群のみが検出され、個々の菌株は検出されなかったが、ショットガンシーケンシングでは10種の微生物がすべて検出された(図4C)。ショットガンシークエンシングではすべての個体群が同定されたが、その定量精度は、群集内の遺伝的類似性の高さに影響された(図S4)。このようなシナリオでは、サンプルにはかなりの割合であいまいなリード(参照データベースの複数のターゲットに等しくマップされるリード)が含まれる。このようなリードは、捨てられるか、LCA(Lowest Common Ancestor)に割り当てられるか、あるいはランダムに複数のマッピング微生物に分散される(46)。曖昧なリードの運命は、研究の目的、使用するパイプライン、下流のアプリケーションによって異なる。SSSコミュニティでは、LCAのアプローチでは期待する解像度が得られず、リードを捨てると60%程度が除去され、菌株やサブストレインの微生物量が大きく過小評価された(図S4)。そこで、Bowtie2(47)に曖昧なリードをランダムに分配するように指示し、coverM(48)を用いて微生物を定量したところ、菌株と亜株の定量がほぼ均一になった(図4C)。しかし、これはマルチマッピングリードをランダムに割り当てたことによるアーチファクトであり、偶然にも予想された入力と一致したため、菌株や亜株が不均一な割合で存在するシナリオには適用できないことがわかった。
任意の微生物濃度のコミュニティに対するマルチマッピングリードの影響をさらに調べるために、既知の入力比率でSSSメンバーのインシリコリードを生成し、図4で用いたヒューリスティックアライメントアプローチと、LCAアプローチであるKraken2(49)の両方を用いて、これらの合成リードを解析した(詳細は材料と方法を参照)。ヒューリスティックアライメントとは異なり、このアプローチでは、曖昧なリードをマルチマッピングターゲットにランダムに割り当てようとせず、代わりにLCAに割り当てた。Bracken(50)をKraken2データに適用しなかったのは、B. thetaiotaomicron株とE. coli亜株の定量に必要な解像度を低下させる種レベルでの定量化を避けるためである(図S4)。ヒューリスティックアライメント法とLCA法の両方が、3つの腸内細菌種を正確に定量し、微生物が十分に区別され、リードが自信を持って割り当てられる場合のショットガンシーケンスの精度を確認した(図5AおよびB)。しかし、両パイプラインの定量精度は、遺伝的類似性が高まるにつれて徐々に低下した。注目すべきは、すべての株および亜株について、LCAアプローチで得られた観測された存在量は、ヒューリスティックアラインメントよりもかなり低かったことで、後者の方法によるあいまいなリードのランダムな分布と一致した(図5AおよびB)。これをさらに裏付けるように、Kraken2による定量は、微生物レベルではなくLCAレベルで、菌株と亜株の両方について、かなり正確であることがわかった(図5CとD;図S4)。具体的には、完全なシナリオでは1であると予想される相対存在量に対する観測値の比は、大腸菌LCAでは〜0.8であったのに対し(図5C)、個々の大腸菌亜株では〜0.05から〜0.001に低下した(図5D)。これらのデータから、近縁株に属するリードのほとんどは、テストした方法では明確にマッピングできず、代わりにマルチマッピングターゲットにランダムに分布したことが示唆される。これらの結果から、図4で用いたショットガンシーケンス定量パイプラインは、実際にはSSSコミュニティ内の個々の菌株や亜菌株を正確に定量することができず、代わりにあいまいなリードをランダムに分布させることで均一な存在量を得ていたことが確認された(図4C)。これらの結果を総合すると、ショートリードシーケンスの落とし穴が明らかになり、使用するパイプラインやパラメータについて慎重に検討する必要性が浮き彫りになった。さらに、これらの結果は、PUPpyが設計した分類群特異的プライマーが、近縁性の高い微生物が存在する場合でも、定義された微生物群集における正確な検出と絶対定量を可能にすることを示している。

図5

図5ヒューリスティックアライメントによる遺伝的に近縁な微生物のショットガンシーケンス定量は、マルチマッピングリードのランダムな割り当てにより、相対量を不正確に推定する。(AおよびB)InSilicoSeq(51)を用いて作成した、SSSコミュニティメンバーのin silicoイルミナリードから得られた、観察された相対存在量と期待される相対存在量の散布図。相対存在量は、Bowtie2(47)を用いたヒューリスティックアライメントに基づくアプローチ、CoverM(48)を用いたアプローチ(A)、およびKraken2(49)を用いたLCAアプローチ(B)を用いて算出し、異なるショットガンシーケンス定量化パイプラインを評価した(詳細は材料と方法を参照)。点線は1:1の勾配を表す。青い線とグレーの斜線部分は、各分類群からの全データポイントにフィットした線形回帰を示す。(CおよびD)Kraken2(49)パイプラインを用いて計算した、SSS群集における各LCA(C)および個々のメンバー(D)について、観測された相対存在量と期待される相対存在量の比のボックスプロット。

考察

本研究では、微生物群集における分類群特異的プライマーを設計するための新しい計算パイプラインであるPUPpyを導入した(図1)。PUPpyをマイクロバイオーム研究に応用し、定義されたコミュニティと複雑なコミュニティの両方において、高分解能で絶対細菌数を検出・定量するためのベンチマークを行った(図2~図4)。その結果、PUPpyで設計された分類群特異的プライマーは、定義された細菌群集において、サブストレインレベルまで微生物を検出できることがわかりました(図2; 図S1からS3)。また重要なことに、PUPpyを設計したプライマーを用いることで、複雑な細菌群集においても、その全構成員が不明な場合でも、選択的に分類群を検出することができた(図3; 図S3)。最後に、我々のデータは、微生物特異的プライマーをddPCRで使用することで、微生物の絶対数を定量化し、定義された細菌群集においてショートリード16S rRNAやショットガンシーケンスよりも高い精度と解像度を達成できることを示唆している(図4および5)。
ソフトウェアパッケージとして、PUPpyは特に使いやすさを優先して開発され、必要な手動操作やコマンドラインの知識は最小限に抑えられています。パイプラインは、ターミナルまたは専用GUIから2つの簡単なコマンドで実行でき、CDSファイルを入力として受け取り、分類群特異的プライマーと主要パラメーターを含む表を出力として提供する。他のプライマーデザインツールと異なり、PUPpyは設定ファイルを必要としないため、実行が効率化され、人為的ミスの可能性を減らすと同時に、カスタマイズも可能である。ユーザーはPUPpyの柔軟性と拡張性を活用し、幅広いカスタム微生物群集に対応する分類群特異的プライマーセットを迅速かつ容易に設計することができます。これは、MMseqs2(34)を用いたアライメントベースの戦略によって達成され、コミュニティ内の全遺伝子にわたる迅速な相同性検索と低計算リソースの両方を可能にし、パイプラインを計算クラスタとパーソナルコンピュータの両方に適したものにしている。今回の研究では、計算機クラスタとパーソナルコンピュータの両方で、10メンバーからなるコミュニティでは2-10分、167メンバーからなる複雑なコミュニティでは1時間以内で分類群特異的プライマーを設計することに成功した(詳細は材料と方法を参照)。この柔軟性により、ユーザーは必要に応じて、プライマーの特異性の信頼性を調整するために、提供されるターゲットとノンターゲットの両方の数を増やすことができる。加えて、PUPpyのスケーラビリティは、各ターゲットに対して、異なる遺伝子でも多数のプライマーセットの設計を可能にし、カスタム微生物コミュニティにおける特異性を確認する複数の方法を提供する。
重要なことは、コミュニティーの規模が大きくなると、そのメンバーの遺伝的類似性が高くなり、プライマー設計が難しくなるということである。このようなコミュニティでは、例えばSSSコミュニティの大腸菌MC4100の場合(図3B)のように、アラインメントステップではユニークな遺伝子としてビン詰めされるほど十分に異なる遺伝子が同定されないことがある。ユーザーは "puppy-align "において、4つの重要なパラメーター:(i)最小アライメント同一性、(ii)最小アライメント長、(iii)最小アライメントカバレッジ、および(iv)カバレッジモードを変更することにより、アライメントのストリンジェンシー、ひいては報告されるアライメントの数を調整することができる。alignment identity、length、coverageを下げると、より多くのアラインメントを報告することにより、ストリンジェンシーが増加し、発見されるユニークな遺伝子の総数が減少し、分類群特異的プライマーの特異性が増加する。逆に、これらの値を上げると、アラインメントのストリンジェンシーが下がり、ユニークとみなされる遺伝子数が増える。しかしながら、最小アラインメント同一性、長さ、カバレッジを上げると、偽陽性のユニーク遺伝子を同定するリスクも増加する。したがって、これらのパラメータは、複数の遺伝的に関連した微生物を含む、あるいは含むと予想されるSSSコミュニティなど、必要な場合にのみ慎重に操作すべきである。PUPpyは、アライメントの厳密性を緩和したにもかかわらず、大腸菌MC4100の真にユニークな遺伝子を同定することはできず、偽陽性のみを同定した。このことは、PUPpyが設計したPCRプライマーでは必ずしも可能ではないかもしれないが、適切なシーケンス深度とデータベースを用いれば、ショットガンシーケンスでより高い解像度を達成できる可能性を強調している。全体として、アラインメントパラメーターの操作とは別に、設計したプライマーの適切な機能と特異性を確実にするためには、実験的検証が不可欠であり、常に推奨される。
定義された群集におけるプライマー設計にとどまらず、複雑な微生物相の中で、微生物の構成員に関する事前知識がなくても、高い特異性で細菌ファミリーを検出することに成功した。これは、未知の遺伝子プールのため、アライメントの段階でプライマーの選択性を確認する能力が制限され、困難な作業となる可能性がある。それにもかかわらず、本研究では、156の非ターゲット候補と11のターゲット候補のリストを用いて、従来のマウスの腸内細菌叢に特異的なプライマーカクテルを設計することができた。PUPpyはターゲット分類群間で保存された遺伝子を同定する可能性が高く、複雑なコミュニティであっても偽陽性の可能性を減らすことができる。PUPpyの柔軟性とスケーラビリティはこのアプローチに適しており、法外な計算量に達することなく、多数のCDSファイルを入力としてサポートします。さらに、PUPpyは同じ微生物ターゲットの複数の遺伝子のプライマー設計をスケールアップすることができる。これは、遺伝子の移動、消失、または獲得が起こりうる複雑な群集における縦断的な調査に役立つ可能性がある。現在のところ、PUPpyはプライマー設計の前に系統学的な情報に基づいた遺伝子選択を直接行うことはなく、代わりにターゲット間で保存されたマーカーを同定するために非ターゲットリストに依存している。必要であれば、Phylomark(52)のような系統学的ツールを調べたり、PUPpyによって選択された遺伝子が目的のアプリケーションにとって理想的であることを確認するために、調査の前に遺伝子について学ぶことが推奨される。
最後に、PUPpyが設計した微生物特異的プライマーは、遺伝的に近縁なメンバーが存在する場合でも、定義された細菌群集の絶対微生物数を正確に定量できる可能性を示した。絶対的な微生物数は組成データに変換することができ、個々のメンバーとコミュニティの両方の動態に関する包括的な洞察を提供する。相対値から絶対値への逆の変換は不可能であり、定量的微生物調査におけるddPCRとqPCRの重要な役割が確認された。このような研究において、同じ微生物の複数の遺伝子についてプライマーを設計し、試験することは、単一のコピー数を持つ遺伝子を確実に調査するために有益であろう。設計上、PUPpyは完全な微生物アセンブリが提供された場合、複数コピーで存在する遺伝子を選択しない。しかし、スキャフォールドやコンティグレベルのアセンブリーが入力として使用された場合、同一の遺伝子が複数回存在すると、ゲノム内の同じ位置に折りたたまれる可能性があるため、これは失敗する可能性がある。従って、高精度の微生物定量に重点を置いた調査の前に、複数のプライマーをデザインするか、コピー数を確認することが推奨される。
まとめると、PUPpyは多様な微生物群集における分類群特異的プライマーを設計し、微生物叢をプロファイリングするための高速でユーザーフレンドリーかつスケーラブルなソリューションを可能にする。マイクロバイオーム研究が種レベルを超えた機能的多様性を明らかにし続ける中、種レベル以下の微生物を迅速かつ正確に検出する能力は、この分野の発展に必要な微生物生態系の高解像度特性解析をサポートするだろう。

材料と方法

試薬とリソースを表1に示す。

表1

表1資源表

試薬またはリソース ソース識別子
実験モデル 生物
スイス・ウェブスター・マウス - ジャームフリー・タコニック、社内コロニー SW GF
化学物質
チョップドミート培地 嫌気性菌培養システム AS-811
BD BBL脱水培養培地 ブレインハート
インフュージョン フィッシャーサイエンティフィック B211059
強化クロストリジウム培地 Oxoid CM0149B
豚胃由来ムチン(III型) Sigma-Aldrich M1778-100G
L-システイン Thermo Scientific A1043518
塩化ヘミン MilliporeSigma 37415GM
ビタミンK1Alfa Aesar L10575
寒天 Fisher BioReagents BP1423500
重要な市販アッセイ
DNeasy 血液・組織キット QIAGEN 69504
DNeasy 96 PowerSoil Pro QIAcube HTキット QIAGEN 47021
Quant-iT 1× dsDNA HSアッセイ Invitrogen Q33232
Nextera XT DNAライブラリー調製キット Illumina FC-131-1024
16S rRNAライブラリー調製 シーケンシング・バイオインフォマティクス・コンソーシアム(SBC) NA
2×DreamTaq Green PCRマスターミックス Fisher Bioreagents K1082
アガロース Fisher Bioreagents BP160-500
ddPCR 96ウェルプレート Bio-Rad 12001925
QX200 ddPCR EvaGreenスーパーミックス Bio-Rad 1864034
DG32 自動液滴発生カートリッジ Bio-Rad 1864108
AutoDGシステム用ピペットチップ Bio-Rad 1864120
ddPCR ドロップレットリーダーオイル Bio-Rad 1863004
EvaGreen用自動液滴生成オイル Bio-Rad 1864112
PCRプレートヒートシール、ホイル、ピアサブル Bio-Rad 1814040
SYBR Safe DNAゲル染色 Invitrogen S33102
ソフトウェアとアルゴリズム
MMseqs2https://github.com/soedinglab/MMseqs2 V14.7e284 (34)
R ソフトウェアhttps://www.r-project.org/ Version 4.1.2 (53)
ggplot2https://www.tidyverse.org/ バージョン 3.3.5 (54)
tidyversehttps://www.tidyverse.org/ バージョン 1.3.1 (55)
pyanihttps://github.com/widdowquinn/pyani バージョン 0.2.9 (56)
FastQChttps://www.bioinformatics.babraham.ac.uk/projects/fastqc/ バージョン 0.11.9 (57)
MultiQChttps://github.com/ewels/MultiQC バージョン 1.10.1 (58)
fastphttps://github.com/OpenGene/fastp バージョン 0.23.2 (59)
Bowtie2https://github.com/BenLangmead/bowtie2 バージョン 2.4.2 (47)
CoverMhttps://github.com/wwood/CoverM バージョン 0.6.1 (48)
Kraken2https://github.com/DerrickWood/kraken2 バージョン 2.1.2 (49)
InSilicoSeqhttps://github.com/HadrienG/InSilicoSeq バージョン 1.5.4 (51)
primer3-pyhttps://github.com/libnano/primer3-py バージョン 0.6.1 (35)
pandashttps://github.com/pandas-dev/pandas バージョン 1.5 (60)
biopythonhttps://github.com/biopython/biopython バージョン 1.80 (61)
daskhttps://github.com/dask/dask バージョン 0.15.2 (62)
seabornhttps://github.com/mwaskom/seaborn バージョン 0.13.0 (63)
matplotlibhttps://github.com/matplotlib/matplotlib バージョン 3.8.2 (64)
coloramahttps://github.com/tartley/colorama バージョン 0.4.1 (65)
QIIME2https://qiime2.org/ バージョン 2023.2 (41)
DADA2https://github.com/benjjneb/dada2 バージョン 1.20 (66)
Guppyhttps://nanoporetech.com/ バージョン 4.5.3 (67)
かつお https://github.com/nanoporetech/bonito バージョン 3.1 (68)
Flyehttps://github.com/fenderglass/Flye バージョン 2.7 (69)
ラコン https://github.com/isovic/racon バージョン 1.4.22 (70)
メダカ https://github.com/nanoporetech/medaka バージョン 1.4.3 (71)
CheckMhttps://github.com/Ecogenomics/CheckM バージョン 1.0.18 (72)
Prokkahttps://github.com/tseemann/prokka バージョン 1.14.5 (73)
SILVA データベースhttps://www.arb-silva.de/documentation/release-1381/ バージョン 138.1 (74)
QX Manager 2https://www.bio-rad.com/en-ca/life-science/digital-pcr/qx-software バージョン 2.0 (Bio-Rad)
その他
標準飼料 5K67 - JL Rat & Mouse/Auto 6F
オートクレーブ食 LabDiethttps://www.labdiet.com/product/detail/5k67-labdiet-jl-rat-and-mouse-auto-6f 5K67
自動液滴発生装置 バイオラッド 1864101
PX1 PCRプレートシーラー Bio-Rad 1814000
C1000 タッチサーマルサイクラー Bio-Rad 1851196
QX200 ドロップレットリーダー Bio-Rad 1864003
寄託データ
https://doi.org/10.5683/SP3/HWXPV3

実験モデル

細菌株と培養条件

分類学、出典、個々の培養条件など、本研究で使用したすべての細菌に関するメタデータは表S1にある。本研究で使用したすべての細菌は、以下の雰囲気で嫌気培養した: 5%H2、5%CO2、90%N2 (Linde Canada, Delta, BC, Canada)、37℃。すべての培地は、使用前に嫌気チャンバー(Coy Laboratories, Grass Lake, MI, USA)で少なくとも24時間前還元した。培地名、略号、成分、レシピは表S3にある。すべての微生物は、-80℃で保存したグリセロールストックからそれぞれの培地プレートにストリークし、その後3mLの液体培地にシングルコロニーを接種した。個々の微生物の培養条件と培養時間は表S1にある。

PUPpyパイプラインの実装

技術仕様

PUPpyを含むすべての解析は、16コアのIntel Xeon Silver 4110(2.1GHz) プロセッサ、192 GBのDDR4-2666 ECC RAM、および2 TBのSATAハードディスクドライブを搭載した高性能コンピューティングプラットフォームであるUBC ARC Sockeyeで実行した。PUPpyのワークフローは、MacOS Venturaオペレーティングシステム、8つのパフォーマンスコアを持つ10コアCPU、16コアGPU、16 GB RAM、512 GBソリッドステートドライブを搭載した消費者向けラップトップで再現され、より低い計算リソースでのパイプラインの実行可能性を検証しました。

PUPpyパイプラインの実行

PUPpyパイプラインは、最初に "puppy-align "を実行し、次に "puppy-primers "スクリプトを実行することで、ターミナルから実行できます。また、"puppy-GUI "を実行し、ボタンベースのシステムと対話することで、GUIから両方のコマンドを実行することもできます。より詳細な手順と実行ガイドラインは、下記とPUPpyのGitHubリポジトリ(https://github.com/Tropini-lab/PUPpy)を参照。

入力コード配列ファイルの配列アライメント

PUPpyの最初のコマンドである "puppy-align "は、MMseqs2(34)を用いて、微生物群集中のユーザー提供の全CDSの多対多ローカルペアワイズ配列アライメントを実行する。このスクリプトは、プライマーを設計すべきターゲットのCDSファイルを含むディレクトリを必要とする。オプションとして、非ターゲットのCDSファイルを含むディレクトリを提供することもできる。重要なことは、"puppy-align "スクリプトの入力として提供されたすべてのCDSファイルは、すべての分類群特異的プライマーの特異性を保証するためにアライメントされるということである。実際のプライマー設計は "puppy-primers "スクリプトで行われるため、"puppy-align "スクリプトで選択されるCDSファイルは、定義されたコミュニティーにどの微生物が存在するかを示すためのものである。ユーザーから提供されたCDSファイルは以下の基準を満たしていなければならない: (i)FASTAヘッダーはProkka、RAST、またはNCBIフォーマットで提供されなければならない、(ii)ファイル名は拡張子の前に "cds "という文字列を含んでいなければならない、(iii)ファイル名は拡張子".fna "で終わっていなければならない。コマンド "puppy-align "は、CDSファイル名の文字列"_cds "の前に微生物識別子をすべてのFASTAヘッダーに付加する。読みやすさを向上させるため、ユーザーは、ファイル名の文字列"_cds "の前に、解釈しやすくユニークな微生物識別子を付けてCDSファイル名を付けることが推奨されます。CDSファイル名の例としては、"B_theta_VPI5482_cds.fna "や "B_thetaiotaomicron_VPI_5482_cds_from_genomic.fna "などがあります。ファイル名の変更に続いて、PUPpyはすべての入力CDSファイル(プライマーのターゲットおよび非ターゲットディレクトリから)を1つのファイルに連結し、クエリーとターゲットデータベースの両方を作成するために使用します。次に、PUPpyはMMseqs2(34)(v14.7e284)の "mmseqs search "をデフォルトのパラメータで実行し、クエリーデータベースをターゲットデータベースに対してアライメントする。mmseqs search "のアラインメントパーセンテージ同一性閾値は、"puppy-align "のデフォルト値"-p 0.3 "から変更することができ、アラインメントのストリンジェンシーを増減することができる。p "を0.3より大きくすると、アライメントの厳密性が下がり、ユニークな遺伝子が見つかる可能性が高くなる。これは、入力されたコミュニティが高度に関連していて、デフォルトのパラメータではユニークな遺伝子が見つからない場合を除き、非特異的なプライマー増幅の可能性が高くなるので推奨されない。

分類群特異的プライマー設計

PUPpyの2番目のコマンドである "puppy-primers "は、ユーザーが定義した入力コミュニティのプライマーターゲットに対して分類群特異的プライマーをデザインする(図1A)。「(i)puppy-alignの主要な出力ファイルである "ResultDB.tsv "と、(ii)PUPpyが分類群特異的プライマーを設計すべきプライマーターゲットのCDSファイルを含むディレクトリデフォルトでは、"puppy-primers "は微生物特異的プライマーを設計する(図1B)。例えば、B. thetaiotaomicron、B. ovatus、およびE. coliからなる3メンバーの細菌群集がある場合、微生物特異的プライマーセットはB. thetaiotaomicronのみを増幅し、他の微生物は増幅しない。ユーザーはPUPpyに"-p group "というフラグを付加することで、グループ特異的プライマーの設計を依頼できる(図1B)。例えば、上記と同じ3つのメンバーで構成されるコミュニティを考えると、Bacteroides特異的グループプライマーセットは、B. ovatusと B. thetaiotaomicronの両方を増幅するが、大腸菌は増幅しない。モードに応じて、"puppy-primers "はアライメントファイルを解析し、微生物またはグループ特異的プライマーを設計するための候補CDSを特定する。微生物特異的プライマーでは、自分自身にのみアライメントするCDSが考慮され、グループ特異的プライマーでは、全てのターゲットに存在するCDSが考慮される。"puppy-primers "は、候補遺伝子を長さの順に並べ、Primer3 (35)を利用してプライマーを設計する。すべてのデフォルト値を含む、変更可能なPrimer3のプライマー設計パラメータの包括的なリストは、"puppy-primers -h "を実行することで利用可能です。PUPpyの "puppy-primers "による微生物特異的プライマーとグループ特異的プライマーの主な出力は、それぞれ "UniquePrimerTable.tsv "と "GroupPrimerTable.tsv "である。両ファイルには、同定された遺伝子名、遺伝子配列、プライマーペアペナルティスコア、アンプリコンサイズ、フォワードプライマー配列、リバースプライマー配列、長さ、GC含量、融解温度に関する情報が含まれる。puppy-primers "をmicrobe-specific modeで実行すると、"UniqueGenesPlot.pdf "というバープロットも得られる。これは、入力されたコミュニティのすべてのプライマーターゲットについて見つかったユニーク遺伝子と非ユニーク遺伝子の数を示す。

DNA抽出と定量

細菌gDNAはDNeasy Blood and Tissue Kit (QIAGEN)を用いて抽出し、Quant-iT 1× dsDNA HS (High-Sensitivity) Assay (Invitrogen)を用いて3テクニカルレプリケートで定量した。ここで、Xは1マイクロリットルあたりのナノグラム単位のDNA量であり、NはNCBIによって報告された塩基対(bp)単位のゲノムサイズである(表S1)。

genomiccopiesper 𝜇L=(𝑋ng∗6.0221×1023 molecules /mole)(𝑁∗660 𝑔/mole)∗1×109ng/𝑔

プライマー設計と特異性の検証

本研究で使用した全ての分類群特異的プライマーはPUPpyで設計し(表S2参照)、Thermo Fisher Scientific(https://www.thermofisher.com/order/custom-standard-oligo/)に注文した。カスタム標準DNAオリゴは、乾燥、脱塩し、少なくとも25 nmoleの合成スケールで注文した。

GUTおよびSSSで定義されたコミュニティー

GUTおよびSSSコミュニティー用に設計された分類群特異的プライマーとそれぞれの主要パラメータは表S2にある。GUTおよびSSSコミュニティーの微生物特異的プライマーは、"puppy-align "をデフォルト値で実行し、"puppy-primers "を"-s 125 175 -optm 62 -tmd 1.5 "のパラメーターで実行することにより、別々に設計した。SSS群集の3つの主要な分類群をターゲットとするグループ特異的プライマーは、デフォルト値で "puppy-align "を実行した後、"puppy-primers "を"-p group -pr <taxon_CDSs> -s 125 175 -optm 62 -tmd 1.5 "のパラメータで実行することにより、3つの異なる実行で設計された。プライマーの特異性はPCRとゲル電気泳動で実験的に検証した。(i)プライマー対が標的とするgDNA、(ii)10メンバープールのgDNA、(iii)標的gDNAを含まない10メンバープール、(iv)テンプレートなしのコントロール(水)。10メンバーのGUTおよびSSSコミュニティは、それぞれの微生物gDNAサンプルのゲノムコピーの等しい比率をプールすることによって作られた(上記のように定量化)。

ムリバキュラ科複合体群集

ムリバキュラ科特異的プライマーカクテルは、個々のムリバキュラ科メンバーを標的とした微生物特異的プライマー対をプールすることによって作成した(表S2参照)。複雑なコミュニティ内での特異性を最大化するために、ムリバキュラ科のメンバーをターゲットとする微生物特異的プライマーは、Tropini Strain Libraryで利用可能な167の腸内常在菌(ターゲットとなるムリバキュラ科を含む)の包括的な入力コミュニティに対して設計された(表S1参照)。すべてのムリバキュラ科に特異的なプライマーは、意図したターゲット全体で同じCDSをターゲットとしているが、プライマーのアニーリングに影響を与える可能性のある塩基対の違いを考慮して、異なるプライマーを設計した。PUPpyはムリバキュラ科の全メンバーで共有される遺伝子を同定するために使用され、個々のプライマーは全ターゲットメンバーで特異性が最大になるように手動で設計された。複雑なコミュニティにおけるムリバクラムシ特異的プライマーカクテルの特異性は、ムリバクラムシ欠失・陽性のコンベンショナルマウスモデルを用いて検証された(45)。コンベンショナルマウスに15%(wt/vol)の浸透圧性下剤PEGを7日間投与した。PEG投与後、投与マウス(ムリバクレア科植物欠乏)と未投与マウス(ムリバクレア科植物陽性)の糞便サンプルを採取し、DNeasy 96 PowerSoil Pro QIAcube HT Kit(QIAGEN, Germantown, MD, USA)を用いて、メーカーのプロトコールに従って糞便内容物から全DNAを抽出した。両サンプルにおけるムリバクラムシ科細菌の有無は、16S rRNA配列決定によって確認した。ムリバキュラ科特異的プライマーカクテルは、以下の4つの条件に対してPCRとゲル電気泳動により実験的に検証した:(i)11種類のムリバキュラ科gDNAサンプル、(ii)テンプレートなしのコントロール(水)、(iii)ムリバキュラ科を除いたサンプル、(iv)ムリバキュラ科陽性。
プライマーの実験的検証に用いたすべてのPCR反応には、2×DreamTaq Green PCR Master Mix(Thermo Fisher)7.5μL、NF-H2O 5μL、フォワードおよびリバースプライマー0.75μL(最終濃度340nM)、DNAテンプレート1μLを含む。PCR増幅は、C1000 Touch Thermal Cycler(Bio-Rad)を用いて以下のプログラムで行った: 98℃、2分、40サイクル(98℃、30秒、specific_annealing_T、30秒、72℃、15秒)、72℃、5分、4℃ホールド。各プライマーペアのアニーリング温度(specific_annealing_T)は表S2にある。非特異的増幅を避けるため、伸長時間を1分から30秒に短縮した。増幅後、8μLのPCR産物をSYBR Safe DNA Gel Stain(Invitrogen社製)で染色した1.5%アガロースゲル上で90V、60分間泳動した。プライマーの特異性は、バンドの有無をゲルで目視検査することで評価した(図S1~S3)。

ショットガンおよび16S rRNA配列決定と解析

ライブラリー調製と配列決定は、ブリティッシュコロンビア大学(カナダ、バンクーバー)のSequencing + Bioinformatics Consortium(SBC)が行った。抽出されたDNAはQubit Fluorometryを用いて定量した。その後、イルミナDNAプレップライブラリー調製キット(Illumina, San Diego, CA, USA)を用いてショットガンメタゲノムライブラリーを調製した。これらのライブラリーをNextSeq Mid出力フローセルでシーケンスし、ペアエンド150 bpリードを生成した。16S配列決定のために、16S rRNA遺伝子のV3およびV4領域を、以下のプライマーを用いてPCR増幅した(75): F:5′-TCGTCGGCAGCGTCAGATGTGTATAAGACAGCCTACGGGNGGCWGCAGおよびR:5′-GTCTCGTGGCTCGGAGATGTGTATAAGAGACAGGACTACHVGGGTATCTAATCC。これらのアンプリコンを、Nextera XTプライマー(Illumina, San Diego, CA, USA)を用いた8サイクルのインデックスPCRを用いてシーケンスライブラリに変換した。これらのライブラリーをMiSeq v2フローセル(Illumina, San Diego, CA, USA)でシーケンスし、ペアエンド250 bpリードを生成した。生のベースコールデータ(bcl)は、イルミナのbcl2fastq変換ソフトウェアを用いてfastq形式に変換した。すべての計算解析は、UBC ARC Sockeyeハイパフォーマンスコンピューティングプラットフォームで行った。
Muribaculaceae欠失および陽性サンプルの16Sライブラリー調製(76)は、カナダBC州バンクーバーにあるBC Children's Hospital Research InstituteのGut4Healthで行った。V4領域は以下の配列で増幅した: F:5′-TATGGTAATTGTGYCAGCMGCCGCGGTAAおよびR:5′-AGTCAGTCAGCGACCGACTACCNVGGGTWTCTAAT。アンプリコンライブラリーは、SequalPrep正規化プレート(Applied Biosystems)を用いて精製、正規化、プールした。ライブラリーの濃度は、Qubit二本鎖DNA(dsDNA)高感度アッセイキット(Invitrogen)およびKAPAライブラリー定量キット(Roche)を用いて、メーカーの詳細に従って確認した。精製されたプールライブラリーは、UBCのBioinformatics + Sequencing Consortiumに提出され、Agilent 2100 Bioanalyzer上でAgilent high-sensitivity DNA kit(Agilent)を用いてDNAの質と量を確認した。シーケンシングはIllumina MiSeq v2プラットフォームを用い、2×250ペアエンドリードケミストリーで行った。
ショットガンシーケンスでは、FastQC(57)(v0.11.9)およびMultiQC(58)(v1.10.1)を用いて生リードの品質を評価した。生リードは、fastp (59) (v0.23.2) を用いて、"-q 20 p -3-5 M 20 W 4 w 15 c -l 50 --dedup --dup_calc_accuracy 5 "のパラメータでクリーニングした。クリーンアップされたリードは、ヒューリスティックアライメントアプローチとLCAアプローチの両方を使用して相対存在量を計算するために使用された。発見的アライメントに基づくアプローチでは、Bowtie2(47) (v2.4.2)を用いて、10個の微生物ゲノムを連結したカスタム参照インデックスに、以下のパラメータでリードをマッピングした: 「D 20 R 3 N 0 L 20 -i S,1,0.50 --reorder --no-unal -p 40"。個々の微生物の相対存在量は、CoverM (48) (v0.6.1)を用いて、以下の主要パラメータ "coverm genome -m relative abundance "で計算した。LCAアプローチでは、相対存在量はKraken2(49) (v2.1.2)を用いて、トリミングリード(上述)と10個のそれぞれのコミュニティメンバーのカスタムデータベースを用いて計算した。
16S rRNAシーケンスについては、生リードをFastQC (57) (v0.11.9) で品質チェックし、QIIME2 (41) (v2023.2) で解析して微生物の相対存在量を推定した。リードはDADA2 (66) (v1.20)で処理し、プライマーをトリミングし、品質スコアが30以下の配列を切り捨てた。SILVA(74)(v138.1)の99%データベースで学習させた分類器を用いて、ノイズ除去された配列に分類ラベルを付与した。

インシリコイルミナリードの作成とデータ解析

InSilicoSeq(51)(v1.5.4)を用いて、SSS群集のインシリコイルミナリードをシミュレートした: "--mode basic --draft <SSSgenomes > --coverage <InputCoverage > n_reads 1.1M"。すべてのSSSメンバーのゲノムを用いて、カバレッジによって決定される所望の入力比率でインシリコリードを生成した。InSilicoSeq(51)が提供するデフォルトの"--coverage "値として、uniform、half normal、lognormal、exponential、zero_inflated_lognormalの5つを使用した。これらのin silicoイルミナショットガンシーケンスリードからの相対存在量は、上記のようにヒューリスティックアライメントとLCAアプローチの両方を用いて計算した。

絶対微生物数の定量化

10メンバーのGUTプールとSSSプールの両方について、1マイクロリットルあたりのコピー数で測定した微生物数の絶対定量は、ddPCRで達成した。すべてのddPCR反応はGut4Health(RRID:SCR_023673)で実行された。GUTおよびSSSコミュニティーで検証された同じ微生物特異的プライマーをddPCRで使用した(表S2参照)。各プライマーペアについて、標的を欠くそれぞれの9メンバープールをネガティブコントロールとして実行した。微生物の絶対数は、各生物の1マイクロリットルあたりのコピーを、コミュニティ内の全生物の1マイクロリットルあたりのコピーの合計で割ることにより、相対存在量に変換した。大腸菌MC4100の微生物特異的プライマーを設計できなかったため、SSS群集のddPCRで測定した微生物の相対存在量は、10生物ではなく9生物から算出した。
簡単に説明すると、10種類のGUTおよびSSS gDNAプールをNF-H2O(Fisher Bioreagents)で希釈し、標的DNAの濃度が0~5,000コピー/μLになるようにした。すべてのddPCR反応は、セミスカート付きddPCR 96ウェルプレート(Bio-Rad)で調製し、11μLの2×QX200 ddPCR EvaGreen Supermix(Bio-Rad)、0.45μLのフォワードおよびリバースプライマー(最終濃度204nM)、8.1μLのNF-H2O、および2μLの希釈したgDNAプールを含んだ。ddPCRプレートを、DG32自動液滴発生カートリッジ(Bio-Rad)、AutoDGシステム用ピペットチップ(Bio-Rad)、およびEvaGreen用自動液滴発生オイル(Bio-Rad)とともに、自動液滴発生装置(Bio-Rad)にセットした。液滴生成後、PX1 PCR Plate Sealer(Bio-Rad)を用いてddPCRプレートをpierceable foil(Bio-Rad)でシールした。密封後、ddPCRプレートをC1000 Touch Thermal Cycler(Bio-Rad)にセットし、以下のプログラムで増幅した: 95℃、5分、40サイクル(95℃、30秒、62℃、1分)、4℃、5分、90℃、5分、4℃ホールド。温度変化はすべてランプレート2℃/秒に制限した。液滴の読み取りは、QX200液滴リーダー(Bio-Rad社製)を用いて、ddPCR液滴リーダーオイル(Bio-Rad社製)を用いて行った。振幅閾値の手動選択とデータ解析は、QX Manager v2.0ソフトウェア(Bio-Rad)で行った。

平均ヌクレオチド同一性解析

GUT および SSS コミュニティの ANI 解析は、pyani (56) の ANIb メソッド(v0.2.9)を用いて行った。大腸菌BW25113、MG1655、DH10BのCDSファイルを "cat "コマンドで連結し、大腸菌MC4100のCDSファイルとともにpyaniの入力(-iフラグ)として提供した。ANI出力をRStudioにインポートし、ggplot2を用いてヒートマップをプロットした。

M. intestinaleG6の配列決定とアセンブリー

高分子ゲノムDNA抽出

M. intestinaleG6を表S1に概説した条件に従って培養した。高分子量gDNAはGenomic-tip 100/G Kit (QIAGEN)を用い、製造元のプロトコールに従って単離した。抽出したDNAを4℃で一晩静置した後、Quant-iT 1× dsDNA HS Assay Kit(Invitrogen)を用いて定量し、分光光度計を用いて品質管理した。DNAの完全性は1%アガロースゲルで確認した。

ゲノム配列決定

NEBNext Companion Module for Oxford Nanopore Technologies (ONT) Ligation Sequencing (New England Biolabs, MA, USA)、ONT Ligation Sequencing Kit (SQK-LSK109, Oxford Nanopore Technologies, UK)、Flongle Sequencing Expansion kit (EXP-FSE001, Oxford Nanopore Technologies, UK)を用いて、製造元の指示に従って、M. intestinaleG6の純粋培養液から抽出したgDNAのライブラリー構築を行った。シーケンシングはFlongleフローセル(FLO-FLG001)を用い、MinIONシーケンサー(ONT)で行った。

De novoゲノムアセンブリ

Guppy(67)(v4.5.3)およびBonito(68)(v3.1)モデルを用いてシーケンス生リードをベースコールし、Flye(69)(v2.7)でアセンブルしてドラフトゲノムを作成した。このドラフトゲノムをまずRacon (70) (v1.4.22) で-m 8 x -6 -g -8 -w 500を用いてポリッシュし、次にMedaka (71) (v1.4.3) でカツオのモデルを用いてポリッシュした。
最終的に3,123,480 bpの環状ゲノムが得られ、平均カバレッジは467×であった。CheckM(72)(v1.0.18)を用いてアセンブリの質を評価した結果、完全度は98.4%、コンタミネーションは0.26%であった。また、Prokka (73) (v.1.14.5)を用いて、(i) --addgenes, (ii) --addmrna, (iii) --gffver 3, (iv) --genus Muribaculum, (v) --kingdom Bacteria, (vi) --gcode 11の設定を行い、2,918のCDSを含むアノテーションを行った。

謝辞

私たちがこの研究を行った土地は、xwməθkwəy̓əm(Musqueam)民族の伝統的、先祖伝来の、そして未承認の領土であることを、著者らは認めている。私たちは他の人々にも、自分たちが生活し働く先住民の土地について、https://native-land.ca/
著者らは、有益な議論をしてくれたIan Ghezzi、Paula Otto Andrade von Sperling、Bryan Merrill、Giselle McCallum、Jerry He、Thad Hughes、PUPpyのロゴをデザインしてくれたClaudia Stroppa、「PUPpy」という名前にインスピレーションを与えてくれたJerry He、マウス実験をサポートしてくれたSam Collins、原稿を読んで批判的なフィードバックをくれたGiselle McCallumに感謝したい。また、研究支援をしてくれたAngele Arrietaにも感謝する。本研究は、BC Children's hospital Research InstituteのGut4Health(RRID:SCR_023673)、ブリティッシュコロンビア大学のSequencing + Bioinformatics Consortium(SBC)およびAdvanced Research Computing(ARC)の支援を受けた。著者らは4-Year Fellowship(H.G.、J.C.B.、 およびD.M.P.)、NSERC PGS-D Scholarship(D.M.P.へ)、Canadian Institute for Advanced Research/Humans and the Microbiome(FL-001253 Appt 3362、C.T.へ)、Michael Smith Foundation for Health Research Scholar Award(18239、C.T.へ)、Johnson and Johnson Women in STEM2D Award(015007、C.T.へ)、Canada Foundation for Innovation/Infrastructure Operating Fund(38277)からの支援を受けた。
H.G.、Y.M.F.、J.C.B.、K.M.N.、C.T.:概念化、方法論、ソフトウェア。H.G.、Y.M.F.、J.C.B.、K.M.N.、D.M.P.、C.T.:リソース。H.G.とC.T.:執筆。H.G.、Y.M.F.、D.M.P.:形式分析、検証、調査、データキュレーション、可視化。C.T.:監督、プロジェクト管理、資金獲得。著者全員が投稿前に論文を読み、承認した。

補足資料

図S1 - msphere.00360-24-s0001.tif

図2のサポートデータ。

図S2 - msphere.00360-24-s0002.tif

図3のサポートデータ。

図S3 - msphere.00360-24-s0003.tif

図3Eのサポートデータ。

図S4 - msphere.00360-24-s0004.tiff

株情報に基づくショットガンシーケンスリードのみを用いた微生物定量は、株および亜株の存在量を過小評価する。

凡例 - msphere.00360-24-s0005.docx

補足資料の凡例

表S1 - msphere.00360-24-s0006.xlsx

本研究で使用した細菌。

表S2 - msphere.00360-24-s0007.xlsx

本研究で設計したプライマー。

表S3 - msphere.00360-24-s0008.docx

培地レシピ

ASMは、論文にリンクされている、あるいは論文を通じてアクセスできる補足資料の著作権を所有しません。著者はASMに対し、補足資料ファイルを公開するための非独占的かつ世界的なライセンスを付与しています。再利用を希望される場合は、対応する著者に直接ご連絡ください。

参考文献

1.

Cavicchioli R, Ripple WJ, Timmis KN, Azam F, Bakken LR, Baylis M, Behrenfeld MJ, Boetius A, Boyd PW, Classen AT, et al. 科学者から人類への警告:微生物と気候変動。Nat Rev Microbiol17:569-586.

引用文献へ

相互参照
PubMed
ウェブ・オブ・サイエンス
Google Scholar

2.

Zhu Y-G, Zhu D, Rillig MC, Yang Y, Chu H, Chen Q-L, Penuelas J, Cui H-L, Gillings M. 2023年。生態系マイクロバイオーム科学。

引用文献へ

相互参照

パブコメ

Google Scholar

3.

Zhu A, Sunagawa S, Mende DR, Bork P. 2015. ヒト腸内細菌種の遺伝子含有量における個人差。Genome Biol16:82.

引用文献へ

相互参照

PubMed

ウェブオブサイエンス

Google Scholar

4.

Greenblum S, Carr R, Borenstein E. 2015. ヒト腸内細菌叢の種間で株レベルのコピー数の変異が大きい。Cell160:583-594.

引用文献へ

引用文献

PubMed

ウェブオブサイエンス

Google Scholar

5.

Engfer MB, Stahl B, Finke B, Sawatzki G, Daniel H. 2000. ヒトミルクオリゴ糖は上部消化管における酵素加水分解に抵抗性である。Am J Clin Nutr71:1589-1596.

引用文献へ

相互参照

PubMed

ウェブオブサイエンス

Google Scholar

6.

Sela DA, Mills DA. 2010. 授乳中の微生物叢:ビフィズス菌とミルクオリゴ糖の分子的関連性。Trends Microbiol18:298-307.

引用文献へ

相互参照

パブコメ

ウェブオブサイエンス

Google Scholar

7.

Wang M, Osborn LJ, Jain S, Meng X, Weakley A, Yan J, Massey WJ, Varadharajan V, Horak A, Banerjee R, Allende DS, Chan ER, Hajjar AM, Wang Z, Dimas A, Zhao A, Nagashima K, Cheng AG, Higginbottom S, Hazen SL, Brown JM, Fischbach MA. 2023. 腸内細菌叢の代謝産生を支配する相互作用を明らかにした菌株の脱落。Cell186:2839-2852.

引用文献へ

相互作用

パブコメ

ウェブオブサイエンス

Google Scholar

8.

Ma B, Gavzy SJ, Saxena V, Song Y, Piao W, Lwin HW, Lakhan R, Iyyathurai J, Li L, France M, Paluskievicz C, Shirkey MW, Hittle L, Munawwar A, Mongodin EF, Bromberg JS. 2023. 腸内細菌叢と宿主免疫応答における耐性菌ビフィズス菌の株特異的変化。Sci Rep13:1023.

引用文献へ

引用文献

パブコメ

グーグル奨学生

9.

Dong H, Rowland I, Yaqoob P. 2012. In vitroにおける6種類のプロバイオティクス菌株の免疫機能に対する比較効果。Br J Nutr108:459-470。

引用文献へ

引用文献

PubMed

ウェブオブサイエンス

Google Scholar

10.

ウェブKA、オラゴケO、ベアードT、ニールJ、ファムA、ウェルズTJ、ラムジーKA、ベルSC、サロビッチDS、プライスEP。2022. 慢性肺疾患気道から分離されたプレボテラ属細菌のゲノム多様性と抗菌薬耐性。Microb Genom8:000754.

引用文献へ

相互参照

パブコメ

Google Scholar

11.

Zlitni S, Bishara A, Moss EL, Tkachenko E, Kang JB, Culver RN, Andermann TM, Weng Z, Wood C, Handy C, Ji HP, Batzoglou S, Bhatt AS. 2020. 臨床的なタイムスケールでの細菌間競争を促進する移動性エレメントを、菌株分解マイクロバイオームシークエンシングにより明らかにした。Genome Med12:50.

引用文献へ

相互参照

パブコメ

ウェブオブサイエンス

Google Scholar

12.

Sharon I, Morowitz MJ, Thomas BC, Costello EK, Relman DA, Banfield JF. 2013. 時系列コミュニティゲノム解析により、乳児の腸内コロニー形成期における細菌種、菌株、ファージの急速なシフトが明らかになった。Genome Res23:111-120.

引用文献へ

論文

PubMed

ウェブオブサイエンス

Google Scholar

13.

Bi D, Zhu Y, Gao Y, Li H, Zhu X, Wei R, Xie R, Cai C, Wei Q, Qin H. 2022. フソバクテリウム(Fusobacterium)感染症の高分類学的プロファイリングにより、大腸がんにおける系統特異的相関が明らかになった。Nat Commun13:3336.

引用文献へ

引用

パブコメ

Google Scholar

14.

Sonnenborn U. 2016. Escherichia coli strain Nissle 1917-ベンチからベッドサイドへ、そして戻る:プロバイオティクス特性を持つ特別な大腸菌株の歴史。FEMS Microbiol Lett363:fnw212.

引用文献へ

クロスレフ

パブコメ

ウェブオブサイエンス

Google Scholar

15.

Figler HM, Dudley EG. 2016. 大腸菌O157:H7と常在性大腸菌の相互作用:菌株レベルでの同定の重要性。Expert Rev Gastroenterol Hepatol10:415-417.

引用文献へ

相互参照

PubMed

ウェブオブサイエンス

Google Scholar

16.

Yan Y, Nguyen LH, Franzosa EA, Huttenhower C. 2020. 微生物群集とヒトマイクロバイオームの菌株レベルの疫学。Genome Med12:71.

引用文献へ

相互参照

PubMed

ウェブオブサイエンス

Google Scholar

17.

Sandrin TR, Goldstein JE, Schumaker S. 2013. 菌株レベルでの細菌のMALDI TOF MSプロファイリング:レビュー。Mass Spectrom Rev32:188-217.

引用文献へ

論文

パブコメ

ウェブオブサイエンス

Google Scholar

18.

Noecker C, McNally CP, Eng A, Borenstein E. 2017. ヒトマイクロバイオームの高解像度特性化。Transl Res179:7-23.

引用文献へ

引用文献

PubMed

ウェブオブサイエンス

Google Scholar

19.

Durazzi F, Sala C, Castellani G, Manfreda G, Remondini D, De Cesare A. 2021年。腸内細菌叢の分類学的特徴付けのための16S rRNAとショットガンシーケンスデータの比較。Sci Rep11:3030.

引用文献へ

論文

PubMed

Google Scholar

20.

Callahan BJ, Wong J, Heiner C, Oh S, Theriot CM, Gulati AS, McGill SK, Dougherty MK. 2019. 全長16S rRNA遺伝子の一塩基分解能による高スループットアンプリコンシークエンシング(High-throughput amplicon sequencing of the full-length 16S rRNA gene with single-nucleotide resolution)。Nucleic Acids Res.47:e103。

引用文献へ

引用文献

PubMed

ウェブオブサイエンス

Google Scholar

21.

ショットガンメタゲノムシーケンスの絶対定量化のための synDNA-a synthetic DNA spike-in method for absolute quantification of shotgun metagenomic sequencing,mSystems7:e00447-22.

クロスレフ

パブコメ

Google Scholar

22.

Morton JT, Marotz C, Washburne A, Silverman J, Zaramela LS, Edlund A, Zengler K, Knight R. 2019. リファレンスフレームを用いた微生物組成測定基準の確立。Nat Commun10:2719.

Crossref

PubMed

グーグル奨学生

23.

Kennedy NA、Walker AW、Berry SH、Duncan SH、Farquarson FM、Louis P、Thomson JM、Satsangi J、Flint HJ、Parkhill J、Lees CW、Hold GL、原稿著者リストに名前のないその他のメンバー(姓のアルファベット順): 2014. 16S rRNA遺伝子配列決定によるヒト腸内細菌叢組成の評価に及ぼすDNA抽出キットおよび検査室の違いの影響。PLoS One9:e88982.

引用文献へ

引用文献

PubMed

ウェブオブサイエンス

Google Scholar

24.

Gobert G, Cotillard A, Fourmestraux C, Pruvost L, Miguet J, Boyer M. 2018. Droplet digital PCRは糞便サンプル中の生菌乳酸菌の絶対定量を改善する。J Microbiol Methods148:64-73.

Crossref

PubMed

ウェブオブサイエンス

Google Scholar

25.

Kralik P, Ricchi M. 2017. 微生物診断におけるリアルタイムPCRの基本ガイド:定義、パラメーター、すべて。Front Microbiol8.

引用文献へ

引用文献

ウェブオブサイエンス

Google Scholar

26.

rpoB, a promising marker for analyzing the diversity of bacterial communities by amplicon sequencing. BMC Microbiol. 19:171.

引用文献へ

相互参照

PubMed

ウェブオブサイエンス

Google Scholar

27.

Poirier S, Rué O, Peguilhan R, Coeuret G, Zagorec M, Champomier-Vergès M-C, Loux V, Chaillou S. 2018. gyrB アンプリコンシークエンシングを用いた食肉および魚介類の腐敗微生物叢の種内細菌多様性の解読:16S rDNA V3-V4アンプリコンシークエンシングとの比較解析。PLoS One13:e0204629.

引用文献へ

引用文献

パブコメ

ウェブオブサイエンス

Google Scholar

28.

Ghebremedhin B, Layer F, König W, König B. 2008. Staphylococcus species based on different partial gap, 16S rRNA, hsp60, rpoB, sodA, and Tuf gene sequences. J Clin Microbiol46:1019-1025.

引用文献へ

相互参照

パブコメ

ウェブオブサイエンス

Google Scholar

29.

Dreier M, Berthoud H, Shani N, Wechsler D, Junier P. 2020. Speciesprimer: 細菌種の定量用qPCRプライマーの設計に特化したバイオインフォマティクス・パイプライン。PeerJ8:e8544.

Crossref

パブコメ

Google Scholar

30.

Pritchard L, Holden NJ, Bielaszewska M, Karch H, Toth IK. 2012. 大腸菌O104:H4アウトブレイク株に対する識別性の高い診断用プライマーセットのアラインメントフリー設計。PLoS One7:e34498.

引用文献へ

論文

パブコメ

ウェブオブサイエンス

Google Scholar

31.

Thomsen MCF, Hasman H, Westh H, Kaya H, Lund O. 2017. RUCS:ユニークなコア配列に対するPCRプライマーの迅速な同定。Bioinformatics33:3917-3921.

引用文献へ

論文

PubMed

ウェブオブサイエンス

Google Scholar

32.

Vijaya Satya R, Kumar K, Zavaljevski N, Reifman J. 2010. リアルタイムPCRシグネチャーの設計のためのハイスループットパイプライン。BMC Bioinformatics11:340.

引用文献へ

引用文献

PubMed

ウェブオブサイエンス

Google Scholar

33.

ライト ES. 2016. DECIPHER v2.0を使ってRで生物学的配列のビッグデータを解析する。

引用文献へ

Crossref

Google Scholar

34.

Steinegger M, Söding J. 2017. MMseqs2 は、膨大なデータセットの解析のための高感度タンパク質配列検索を可能にする。Nat Biotechnol35:1026-1028.

Crossref

PubMed

ウェブオブサイエンス

Google Scholar

35.

Untergasser A, Cutcutache I, Koressaar T, Ye J, Faircloth BC, Remm M, Rozen SG. 2012. Primer3--新しい機能とインターフェース。Nucleic Acids Res40:e115.

Crossref

PubMed

ウェブオブサイエンス

Google Scholar

36.

Desai MS, Seekatz AM, Koropatkin NM, Kamada N, Hickey CA, Wolter M, Pudlo NA, Kitamoto S, Terrapon N, Muller A, Young VB, Henrissat B, Wilmes P, Stappenbeck TS, Núñez G, Martens EC. 2016. 食物繊維を欠乏させた腸内細菌叢は、大腸粘液バリアを低下させ、病原体感受性を高める。Cell167:1339-1353.

Crossref

PubMed

ウェブオブサイエンス

Google Scholar

37.

Hsu BB, Gibson TE, Yeliseyev V, Liu Q, Lyon L, Bry L, Silver PA, Gerber GK. 2019. マウスモデルにおけるバクテリオファージによる腸内細菌叢とメタボロームの動的調節。Cell Host Microbe25:803-814.

引用文献へ

相互参照

PubMed

ウェブオブサイエンス

Google Scholar

38.

Elzinga J, van der Oost J, de Vos WM, Smidt H. 2019. ヒト腸内における宿主と微生物の相互作用をモデル化するための定義された微生物群集の利用。Microbiol Mol Biol Rev83:e00054-18.

引用文献へ

引用文献

PubMed

ウェブオブサイエンス

Google Scholar

39.

ングKM、パンヌS、リューS、ブルクハルトJC、ヒューズT、ヴァン・トレウレンW、グエンJ、ナクヴィK、グエンB、クレイトンCA、ペピンDM、コリンズSR、トロピーニC。腸内細菌叢における環境pHと浸透圧への応答を予測する単一菌株の挙動bioRxiv.

引用文献へ

クロスフィルム

Google Scholar

40.

Marcobal A, Kashyap PC, Nelson TA, Aronov PA, Donia MS, Spormann A, Fischbach MA, Sonnenburg JL. 2013. ヒトの腸内細菌叢が宿主のメタボロームにどのような影響を与えるかを、ヒト化マウスとグノトビオティックマウスを用いてメタボローム学的に明らかにした。ISME J7:1933-1943.

引用文献へ

引用文献

パブコメ

ウェブオブサイエンス

Google Scholar

41.

Bolyen E, Rideout JR, Dillon MR, Bokulich NA, Abnet CC, Al-Ghalith GA, Alexander H, Alm EJ, Arumugam M, Asnicar F, et al. QIIME 2.8を用いた再現可能、インタラクティブ、スケーラブル、拡張可能なマイクロバイオームデータサイエンス。Nat Biotechnol37:852-857.

Crossref

PubMed

ウェブオブサイエンス

Google Scholar

42.

Seedorf H, Griffin NW, Ridaura VK, Reyes A, Cheng J, Rey FE, Smith MI, Simon GM, Scheffrahn RH, Woebken D, Spormann AM, Van Treuren W, Ursell LK, Pirrung M, Robbins-Pianka A, Cantarel BL, Lombard V, Henrissat B, Knight R, Gordon JI. 2014. マウス腸内で多様な生息地の細菌がコロニー形成し、競合する。Cell159:253-266.

引用文献へ

引用

PubMed

ウェブオブサイエンス

Google Scholar

43.

Lagkouvardos I, Lesker TR, Hitch TCA, Gálvez EJC, Smit N, Neuhaus K, Wang J, Baines JF, Abt B, Stecher B, Overmann J, Strowig T, Clavel T. 2019. Muribaculaceaeの配列および培養研究により、この未記載ファミリーの新規種、宿主嗜好性、および機能的可能性が明らかになった。Microbiome7:28.

Crossref

PubMed

Google Scholar

44.

Ormerod KL, Wood DLA, Lachner N, Gellatly SL, Daly JN, Parsons JD, Dal'Molin CGO, Palfreyman RW, Nielsen LK, Cooper MA, Morrison M, Hansbro PM, Hugenholtz P. 2016. 恒温動物の腸内に生息する未培養バクテロイデス類S24-7ファミリーのゲノム特性解析。Microbiome4:36.

引用文献へ

論文

PubMed

グーグル

45.

Tropini C, Moss EL, Merrill BD, Ng KM, Higginbottom SK, Casavant EP, Gonzalez CG, Fremin B, Bouley DM, Elias JE, Bhatt AS, Huang KC, Sonnenburg JL. 2018. 一過性の浸透圧擾乱は、腸内細菌叢に長期的な変化を引き起こす。Cell173:1742-1754.

Crossref

PubMed

ウェブオブサイエンス

Google Scholar

46.

Zhao C, Shi ZJ, Pollard KS. 2023. 急速に増加するゲノムコレクションを用いた微生物群集の遺伝子型解析の落とし穴。Cell Systems14:160-176.

引用文献へ

引用文献

パブコメ

ウェブオブサイエンス

Google Scholar

47.

Langmead B, Salzberg SL. 2012. Bowtie 2による高速ギャップドリードアライメント。Nat Methods9:357-359.

Crossref

パブコメ

ウェブオブサイエンス

Google Scholar

48.

wwood/Coverm: Read coverage Calculator for Metagenomics. https://github.com/wwood/CoverM

Google Scholar

49.

Wood DE, Lu J, Langmead B. 2019. Kraken 2によるメタゲノム解析の改善。Genome Biol20:257.

Crossref

PubMed

ウェブオブサイエンス

Google Scholar

50.

Lu J, Breitwieser FP, Thielen P, Salzberg SL. 2017. Bracken: estimating species abundance in metagenomics data. PeerJ Comput Sci3:e104.

引用文献へ

Crossref

グーグル・スカラー

51.

Gourlé H, Karlsson-Lindsjö O, Hayer J, Bongcam-Rudloff E. 2019. InSilicoSeqによるイルミナメタゲノムデータのシミュレーション。Bioinformatics35:521-522.

Crossref

PubMed

ウェブオブサイエンス

Google Scholar

52.

Sahl JW, Matalka MN, Rasko DA. 2012. Phylomark、全ゲノムアラインメントから保存された系統マーカーを同定するツール。Appl Environ Microbiol78:4884-4892.

引用文献へ

論文

論文

ウェブオブサイエンス

Google Scholar

53.

Ihaka R, Gentleman R. 1996. R: データ解析とグラフィックスのための言語。J Comput Graphical Stat5:299-314.

引用文献へ

引用

グーグル・スカラー

54.

Wickham H. 2016. H. Wickham編.ggplot2: Elegant Graphics for Data Analysis, p 11-31. Elegant Graphics for Data Analysis. Springer International Publishing, Cham.

引用文献へ

引用

グーグル・スカラー

55.

Wickham H, Averick M, Bryan J, Chang W, McGowan LD, François R, Grolemund G, Hayes A, Henry L, Hester J, Kuhn M, Pedersen TL, Miller E, Bache SM, Müller K, Ooms J, Robinson D, Seidel DP, Spinu V, Takahashi K, Vaughan D, Wilke C, Woo K, Yutani H. 2019. tidyverseへようこそ。JOSS4:1686.

引用文献へ

クロスフィルム

グーグル・スカラー

56.

Pritchard L, Glover RH, Humphris S, Elphinstone JG, Toth IK. 2016. 食品安全保障のための診断におけるゲノミクスと分類学:軟腐性腸内細菌性植物病原体。Anal. Methods8:12-24.

クロスレフ

ウェブ・オブ・サイエンス

Google Scholar

57.

Andrews S, Krueger F, Segonds-Pichon A, Biggins L, Krueger C, Wingett S. 2012. FASTQC: a quality control tool for high throughput sequence data (0.11.9).

Google Scholar

58.

Ewels P, Magnusson M, Lundin S, Käller M. 2016. MultiQC: 複数のツールやサンプルの解析結果を1つのレポートにまとめる。Bioinformatics32:3047-3048.

Crossref

PubMed

ウェブオブサイエンス

Google Scholar

59.

Fastp: an ultra-fast all-in-one FASTQ preprocessor. Bioinformatics34:i884-i890.

Crossref

PubMed

ウェブオブサイエンス

Google Scholar

60.

McKinney W. 2010. 「統計計算のためのデータ構造 in Python" Python in Science Conference; Austin, Texas.

引用文献へ

引用

グーグル・スカラー

61.

Cock PJA, Antao T, Chang JT, Chapman BA, Cox CJ, Dalke A, Friedberg I, Hamelryck T, Kauff F, Wilczynski B, de Hoon MJL. 2009. Biopython: 計算分子生物学およびバイオインフォマティクスのための自由に利用できるPythonツール。Bioinformatics25:1422-1423.

引用文献へ

クロスリファレンス

パブコメ

ウェブオブサイエンス

Google Scholar

62.

Rocklin M. 2015. "Dask: blocked algorithms and task scheduling with parallel computation" Python in Science Conference; Austin, Texas:, p 126-132.

引用文献へ

Crossref

グーグル・スカラー

63.

Waskom ML. 2021. Seaborn:統計的データ可視化。JOSS6:3021.

引用文献へ

クロスリファレンス

グーグル・スカラー

64.

Hunter JD. 2007. Matplotlib: 2Dグラフィックス環境. Comput Sci Eng9:90-95.

引用文献へ

クロスリファレンス

ウェブオブサイエンス

Google Scholar

65.

Tartley/Colorama: Pythonによるシンプルなクロスプラットフォームのカラー端末テキスト。https://github.com/tartley/colorama

引用へ

グーグル・スカラー

66.

Callahan BJ, McMurdie PJ, Rosen MJ, Han AW, Johnson AJA, Holmes SP. 2016. DADA2:イルミナアンプリコンデータからの高分解能サンプル推論。Nat Methods13:581-583.

Crossref

PubMed

ウェブオブサイエンス

Google Scholar

67.

グッピー オックスフォード・ナノポア・テクノロジーズ社。https://community.nanoporetech.com/docs/prepare/library_prep_protocols/Guppy-protocol/v/gpb_2003_v1_revax_14dec2018/guppy-software-overview。

Google Scholar

68.

Seymour C, Oxford Nanopore Technologies Ltd. 2019. nanoporetech/bonito: A Pytorch Basecaller for Oxford nanopore reads.https://github.com/nanoporetech/bonito.

Google Scholar

69.

Kolmogorov M, Yuan J, Lin Y, Pevzner PA. 2019. リピートグラフを用いた長くてエラーが起こりやすいリードのアセンブリー。Nat Biotechnol37:540-546.

Crossref

PubMed

ウェブオブサイエンス

Google Scholar

70.

Vaser R, Sović I, Nagarajan N, Šikić M. 2017. 長い未補正リードからの高速かつ正確なde novoゲノムアセンブリ。Genome Res27:737-746.

Crossref

PubMed

ウェブオブサイエンス

Google Scholar

71.

Oxford Nanopore Technologies Ltd. 2018. nanoporetech/medaka: Sequence correction provided by ONT research.https://github.com/nanoporetech/medaka.

Google Scholar

72.

Parks DH, Imelfort M, Skennerton CT, Hugenholtz P, Tyson GW. 2015. CheckM: 分離株、単細胞、メタゲノムから回収した微生物ゲノムの品質評価。Genome Res25:1043-1055.

クロスリファレンス

PubMed

ウェブオブサイエンス

Google Scholar

73.

Seemann T. 2014. Prokka: 迅速な原核生物のゲノムアノテーション。Bioinformatics30:2068-2069.

Crossref

医学・生物学

ウェブオブサイエンス

Google Scholar

74.

Quast C, Pruesse E, Yilmaz P, Gerken J, Schweer T, Yarza P, Peplies J, Glöckner FO. 2013. SILVAリボソームRNA遺伝子データベースプロジェクト:改良されたデータ処理とウェブベースのツール。この論文では、SILVAリボソームRNA遺伝子データベースの概要や、SILVAリボソームRNA遺伝子データベースを用いた遺伝子発現の解析結果について報告する。

クロスリファレンス

医学・薬学

ウェブオブサイエンス

Google Scholar

75.

Herlemann DP, Labrenz M, Jürgens K, Bertilsson S, Waniek JJ, Andersson AF. 2011. バルト海の2000km塩分勾配に沿った細菌群集の変遷。ISME J5:1571-1579.

引用文献へ

Crossref

パブコメ

ウェブオブサイエンス

Google Scholar

76.

デ・ウルフTJ、ライトES. 2023. サンプル調製からバイオインフォマティクス解析までのアンプリコンシーケンスワークフローの多因子検討。BMC Microbiol23:107.

引用文献へ

引用文献

パブコメ

ウェブオブサイエンス

Google Scholar

全文表示|PDFダウンロード



学術雑誌

いつでもつながる

ニュース

著作権 © 2024 米国微生物学会

PDFヘルプ


この記事が気に入ったらサポートをしてみませんか?