シングルセルロングリードシーケンスで明らかにする未培養ヒト腸内細菌の種内多様性


34
総閲覧数
記事の altmetric スコアは 2 です。
ORIGINAL RESEARCH(オリジナル研究)論文
Front. Microbiol.、2023年2月24日
Sec. Evolutionary and Genomic Microbiology(進化とゲノム微生物学
第14巻 - 2023年|https://doi.org/10.3389/fmicb.2023.1133917
シングルセルロングリードシーケンスで明らかにする未培養ヒト腸内細菌の種内多様性
粉川真人1、西川洋平1,2、佐伯達也3、依田卓也3、有川浩二3、武山晴子1,2,4,5、細川雅仁1,2,3,4,5*(敬称略、以下同
1早稲田大学ナノ・ライフ・イノベーション研究機構(日本
2独立行政法人 産業技術総合研究所 バイオビッグデータオープンイノベーション研究部門 (日本)
3bitBiome株式会社、日本、東京
4早稲田大学理工学部生命医科学科(日本
5早稲田大学理工学術院生命システム動態研究センター(日本
完全かつ正確な細菌ゲノムの取得は、未培養細菌の特性を研究する上で不可欠である。シングルセルゲノミクスは、個々の細胞から細菌ゲノムを培養によらず回収する有望なアプローチである。しかし、シングル増幅ゲノム(SAG)は、ゲノム増幅の過程で導入されるキメラ配列やバイアス配列により、断片化した不完全な配列を持つことが多い。そこで我々は、未培養細菌のロングリード単細胞シーケンスデータから完全な環状SAG(cSAG)を構築する単細胞増幅ゲノムロングリードアセンブリ(scalab)ワークフローを開発した。我々は、費用対効果が高くハイスループットなSAG-gelプラットフォームを用い、特定の細菌株について数百のショートリードおよびロングリードのシーケンスデータを取得した。scALAワークフローでは、配列バイアスの軽減とコンティグアッセンブリーのためのインシリコ処理を繰り返し、cSAGを生成しました。2つの同居グループを含む12個のヒト糞便サンプルから、scALAは3つの特定対象細菌種について16個のcSAGを生成しました。Anaerostipes hadrus、Agathobacter rectalis、Ruminococcus gnavusの3菌種について、16個のcSAGを生成した。その結果、同居宿主に共通する菌株固有の構造変異を発見した一方、同一菌種のcSAGはすべてゲノム配列に高い相同性を示しました。A. hadrus cSAGsは、10kbp長のファージ挿入、様々な糖代謝能力、各株で異なるCRISPR-Casシステムを有していることが明らかになった。A. hadrusゲノムの配列の類似性は、必ずしも機能遺伝子のオーソログと一致せず、宿主の地理的地域性が遺伝子保有に大きく関係しているようでした。 scALAにより、ヒト微生物叢サンプルから特定の標的菌の閉鎖循環ゲノムを取得し、構造の変異やファージなどの移動性遺伝要素と宿主との関連など、種内の多様性の理解につなげていくことができました。本手法で構築したcSAGは、細菌ゲノムデータベースを拡張し、未培養細菌の種内多様性の理解を深めることができる。

  1. 1.はじめに
    腸内細菌叢は宿主の生理・代謝を制御する重要な役割を担っており、この関係を理解するために細菌ゲノムの培養非依存的解析が重要な鍵を握ってきた。しかし、ヒトの腸内細菌群の約半数は参照ゲノムが存在せず、特定の生物に正確に機能を割り当てたり、微生物群を分類したりすることは困難である。近年、アセンブルおよびビニングアルゴリズムを用いた短リードシーケンスにより、多数のメタゲノム組み立てゲノム(MAGs; Nayfach et al., 2019; Pasolli et al., 2019; Almeida et al., 2021)が得られたが、これらは非連結座、欠損rRNA遺伝子、キメラ配列など組み立て品質が低い(Bowers et al., 2017; Shaiber and Eren, 2019; Van Rossum et al., 2020)。このようなゲノムの不完全性は、MAG由来の参照データベースの品質や、特に腸内細菌の種内多様性を特徴付けるという点で、MAGに基づく研究の妥当性について懸念を抱かせる。

シングルセルゲノミクスは、集団ではなく個々の細胞の配列を決定することにより、培養に依存しない方法で細菌ゲノムを回復できる代替アプローチである(Woyke et al.、2017)。このプロセスでは、単一の細菌細胞を分離、溶解し、多重置換増幅法(MDA; Lasken, 2007)と呼ばれる技術を用いてゲノムを増幅する。MDAは、高い忠実度と大きなフラグメントサイズで十分なDNAを生成する一方で、単一ゲノム内にキメラアーチファクトを導入し、特定のゲノム領域のカバーに偏りが生じることがあります(Kogawa et al.、2018)。その結果、単一増幅ゲノム(SAG)は断片化した不完全な配列に誤りがあることが多く、SAGに関する最小限の情報基準(Rinke et al., 2014; Bowers et al., 2017)に従って、最低限の数の高品質ドラフトSAGおよびサーキュラーSAG(cSAG)が回収されているに過ぎない。

本研究では、ハイスループットなシングルセルゲノムシーケンスを用いて、未培養のヒト腸内細菌叢から完全なゲノムを回収しました。超並列単一細菌ゲノムシーケンス技術であるSAG-gel(SAGs in gel beads sequencing)プラットフォーム(Chijiiwa et al., 2020; Arikawa et al., 2021; Hosokawa et al., 2022; Ide et al., 2022; Nishikawa et al., 2022)とナノポア・ロングリードシーケンサー(Bertrand et al., 2019; Moss et al., 2020)と組み合わせ、単一細菌ゲノムシーケンスを実施した。我々は、単細胞ロングリード配列に特化したゲノムアセンブルパイプラインを開発し、大腸菌の単細胞MDA産物を用いてその性能を検証した。次に、未培養のヒト腸内細菌の単細胞MDA産物から得られたClostridiales目に属する3種の細菌にこのパイプラインを適用した。これにより、これらの完全閉鎖型ゲノムの構造変異と移動性遺伝要素を特徴付けることができた。

  1. 研究成果
    2.1. 2.1. 大腸菌単細胞ゲノムを用いた従来のロングリードアセンブリ・パイプラインの評価
    大腸菌SAGに由来するショートリード配列は、複数のデータの共アセンブリによりキメラやバイアスの影響を軽減し、単離ゲノムと同等の品質(完全性97%以上)のドラフトゲノムが複合ショートリードSAG(CSR-SAG;Kogawa et al., 2018)として得られます。しかし、ショートリード配列情報に基づくアセンブリの観点からは、単一細胞・分離株ともに得られたコンティグは170個前後と断片的である。de novoアセンブリで円形ゲノムを得るためには、シーケンシングリードの断片長を長くして、アセンブリするコンティグの長さを伸ばす必要があり、ロングリードシーケンスを活用する必要がある。

まず、大腸菌の単細胞MDA産物から構築したロングリードSAG(LR-SAG)を既存のロングリードアセンブラを用いて評価し、単細胞ロングリード配列(scLRs; Supplementary Table S1)のde novoアセンブリにおける問題を明らかにした。まず、大腸菌K-12の96個の単細胞MDA産物をSAG-gelプラットフォーム(Chijiiwa et al., 2020)を用いて調製し、次に5個の増幅ゲノムをランダムに選択してナノポアシーケンサーを用いて個別に塩基配列を決定した。scLR(各300 Mb)を1つのファイルにマージし、3種類のロングリード・アセンブラを用いてアセンブルした。Flye(Kolmogorov et al.、2019)、miniasm(Li、2016)、およびCanu(Koren et al.、2017;補足表S1)。培養菌から抽出したゲノムのシーケンスで信頼性が高いことで有名なFlyeが作成したLR-SAGは、ゲノム完全性が1.53%しかなく、配列情報のほとんどを失っていた。同様に、miniasm社のLR-SAGはゲノム完全性が1.17%であった。一方、キメラ配列処理ユニットを内蔵したCanuのLR-SAGは、87.5%と高いゲノム完全性を有していた。しかし、このアセンブリには、重複率1.039に示されるように、同じ配列情報を持つ多数の断片を含む61個のコンティグが含まれていた。

そこで、アセンブリの質を高めるために、まずCanuを用いてscLRからキメラを除去し、Flyeとminiasmを用いて再アセンブリを行いました。その結果、コンティグ数は減少し(それぞれ39と47)、ゲノムの完全性は70%以上を維持した。しかし、これらのアセンブリの最大ゲノム完全度は87.5%であり、ショートリードシーケンスと比較して、依然としてかなりのゲノム配列情報が失われていることが示された。また、LR-SAGの相対深度の小さいscLR配列領域を調べたところ、組み立てられたコンティグから配列が欠落していた(補足図S1)ことから、scLRの配列バイアスを改善すれば、組み立て品質を向上させることができると推測された。

2.2. 2.2. ロングリード配列のバイアスを軽減することによるゲノム完全性の向上
我々は、増幅バイアスとキメラ配列を持つscLRからドラフト細菌ゲノムを組み立てるために、単一細胞増幅ゲノムロングリードアセンブリ(scALA)パイプラインを開発しました(図1A)。このパイプラインは、まず入力リードから低品質リードを除去し、配列のデビアス処理のための参照コンティグを構築する。Canuを用いたキメラ除去の後、Flyeを用いて入力リードを中間参照コンティグにアセンブルします。その後、参照コンティグに対して入力リードをマッピングし、リード深度が高い領域を特定し、過剰なリードを除去して入力リードをデビアスする(図1A)。その後、バイアスを除去したリードを再集合して、ゲノムカバレッジの幅が改善されたLR-SAGを構築し、新たな参照コンティグとして、さらにバイアスを除去して再集合します。このプロセスを繰り返すことで、ゲノムの完全性が向上した連続配列が得られます。コンセンサス配列は、デバイアシングとアセンブリのサイクルで得られた中間参照配列から構築されます。このコンセンサス配列に、同じMDA産物から得られたシングルセル・ショートリード配列(scSR)を加えて研磨することにより、最終的な完全ゲノムを得ることができます。

図1
www.frontiersin.org
図1. 1. 円形細菌ゲノムを得るための単一増幅ゲノムロングリードアセンブリ(scALA)パイプラインのワークフロー。(A)SAGから得られたオリジナルのシングルセルロングリード配列(scLR)をアセンブルすると、ゲノムの不均一な増幅によって配列深度に偏りが生じるため、完成度の低いドラフトゲノム(LR-SAG)が得られる(Cycle 0)。そこで、LR-SAGの品質を向上させるために、あらかじめアセンブルされた中間ドラフトLR-SAGにリードをマッピングして、デバイアスされたロングリードのアセンブルを繰り返す(Cycle 1, Cycle 2, ...).最後に、各サイクルにおいて複数の中間ドラフトLR-SAGを足場にして、円形LR-SAG(cSAG)を得る。(B-F) scALA処理におけるLR-SAGの品質(B:コンティグ数、C:ゲノム割合、D:最大コンティグの長さ、E:NG50、F:全長)。線図の色は、同じ大腸菌のscLRデータセットを用いた各scALA解析の試行を示しています。

LR-SAGの完全性に対するバイアス低減の影響を評価するため、前節で従来のロングリードアセンブリツールの評価にも使用した、マージした大腸菌scLRを用いた(図1B-F、trial-a)。de novoアセンブリ後、デバイズ前のscLRから39コンティグからなるLR-SAGが得られ、ゲノムの完全性は81.7%であった。一方、1回目のデバイアス後にscLRから構築したLR-SAGは13コンティグからなり、ゲノムの完全性は99.3%であったことから、バイアスの低減によりゲノムの完全性が向上することが示された。さらに、デバイズを繰り返してコンティグ数を2つに減らし、最終的に最大コンティグ長4.66 Mbpの完全長大腸菌ゲノム配列が得られた。もう1つのコンティグは、大腸菌のFプラスミド配列であった。これらの結果は、脱バイアス処理を繰り返すことで、scLRから完全なSAGを構築することができ、完全性の向上と配列のギャップを埋めることで、結果的にコンティグを減少させることが可能であることを示しています。

再現性の高い円形SAGを得るためには、脱バイアスのサイクルを繰り返すことと、そのサイクルで生じた複数の参照コンティグを足場とすることが重要である。各試験において、出力ゲノム中のコンティグの数とサイズに違いがあることが確認された(図1B〜F)。同じ大腸菌のscLRを用いた3つの検証試験(a、b、c)では、デバイズサイクル前に39-43コンティグを含む同様のLR-SAGが得られ、ゲノムの完全性は81.7-83.2%であった。しかし、4 回のデバ イシングとアセンブリを行った結果、cSAG を構築できたのは 3 試行中 1 回だけであった(補 表 S2)。この違いは、Flyeのアセンブリアルゴリズムの一部にランダムな値が使用されているためと思われる。ゲノムアセンブリでは再現性のある結果を得るためにランダムシードを設定するのが一般的であるが、本検証では意図しないランダムシードの設定がcSAGの取得を妨げている可能性が示唆された。また、各ステップで得られたLR-SAG(中間参照コンティグ)のアラインメントから、配列断片の末端が異なるゲノム位置にあることがわかり、各LR-SAGのBLAST相同性検索から、配列断片をつなぎ合わせ、合意配列として拡張できることがわかった(補足図S2)。そこで、異なるアセンブルサイクルで得られた全ての参照コンティグを足場にして、最終出力としてコンセンサスコンティグを生成するプロセスをパイプラインに実装した。この結果、すべての試験からcSAGが構築された(図1B;補足表S2)。

2.3. 異なる宿主から取得した腸内細菌単一増幅ゲノムのゲノム比較解析
補足表S3に示した2つの同胞群を含む12個のヒト糞便サンプルから得られた細菌種のcSAGを取得した。まず、SAGゲルプラットフォーム(Chijiiwa et al., 2020)で調製した単細胞MDA産物からヒト腸内細菌のショートリード(SR)-SAGを96個ランダムに取得し、HiSeqシーケンサーでscSRデータを取得した。scSRをde novoアセンブルした後、同一株のSR-SAGを統合してCSR-SAGを構築した(Kogawa et al.,2018)。その後、複数の検体からCSR-SAGが90%以上の完全性を示す特定の細菌種を同定した。図2Aに示すように、宿主間で共有され、宿主健康関連菌として知られるAnaerostipes hadrus、Agathobacter rectalis、Ruminococcus gnavusの3菌種を対象とした(Henke et al.2019; Zeevi et al.2019; Wang et al.2021 )。選択した種のCSR-SAGのほとんどは、高品質(HQ)または中品質(MQ)と認定され、100以上のコンティグからなる高いゲノム完全性(95%以上)を有していた(補足表S4)。

図2
www.frontiersin.org
図2. A. hadrus, A. rectalis, R. gnavusの腸内細菌SAGの系統樹解析。(A) 3種のSAG間の平均塩基配列一致度(ANI)のヒートマップ。左側のタイルは、得られたSAGの宿主を示す。宿主の凡例にある色のついた星は同居人を示す。中央のタイルは、short-read (SR)-SAG間のANIを示す。右側のタイルは、異なるステップで処理されたSAGの完全性を表す[左列:生のSR-SAG、中列:複合短焦点SAG(CSR-SAG)、右列:複合長焦点SAG(LR-SAG)]。パネルB,Cに示すように、分離株やメタゲノムから得られた一般に公開されているA. hadrusゲノムと我々のA. hadrus SAGを比較した。(B) コア遺伝子の一塩基多型(SNP)に基づくA. hadrusゲノムの樹形図。ラベルの色は、A. hadrusゲノムを入手した国を示す。右側の色帯は、Uniform Manifold Approximation and Projection (UMAP)解析に基づくゲノムグループを表しています(C)。色のついた星印は、同居者から得られた近縁のSAGである。(C) A. hadrusゲノムの相同遺伝子群の存在に基づくUMAPプロット。点の色は細菌サンプルが得られた国、点の形はゲノム配列のデータ型を示す。

SR-SAGのペアワイズ平均塩基同一性(ANI)クラスタから、異なる宿主間で共有されているA. hadrus株、G010c01株とG011c23株、またはG012c40株、G013c12株とG015c54株の存在が示唆された(図2A;補図S3)。これらの特定菌株を保有する宿主群は同居者であった。さらに、得られた9つのCSR-SAGとNational Center for Biotechnology Information (NCBI) ゲノムデータベースから得られた43のA. hadrusドラフトゲノムからなるA. hadrus比較ゲノムセットを用いて、種内の系統解析を行った。これらの菌株について、データセット中の全ゲノムに共通するコア遺伝子の一塩基多型(SNPs)に基 づく系統解析を行った(図 2B)。その結果,同居者由来のANIが99.5%以上の株群は,夫婦間あるいは親子間で共有されているA. hadrus株と考えられる.

各国のゲノムを比較するために、相同な機能遺伝子の有無に基づき各株ゲノムをクラスタリングした。さらに、ゲノム間の Jaccard 距離に基づく Uniform Manifold Approximation and Projection (UMAP) クラスタリングにより、52 ゲノムを 4 グループに分類した(図 2C, n_neighbors = 20)。オーストラリアで得られたA. hadrusゲノムはUMAP解析において地域特異的なクラスタを示したが(図2C)、オーストラリア株はコア遺伝子配列に基づくSNPベースのツリーにおいて複数のクレードに分布した(図2B)。本研究でゲノムを取得した A. hadrus 株 G006c13、G009c41、G010c01、G011c23 も同じ UMAP クラスターに位置していたが、異なるクレードに属していた。コア遺伝子の配列同一性に基づく系統解析は、必ずしも細菌の機能的類似性を表しておらず、より正確に細菌の形質を予測するためには、地理的な菌株のゲノムデータの取得が不可欠であることがわかった。さらに、局所的な構造変化をさらに反映した UMAP プロット(図 2C, n_neighbors = 5)では、G006c13、G009c41、G010c01、G011c23 株が離れた位置にあり、これらの違いを理解するには、各宿主から株分解したゲノムの取得が必要であることが示唆された。

2.4. 単細胞増幅ゲノムロングリードアセンブリを用いたヒト腸内細菌からの円形単増幅ゲノムの取得
A. hadrus, A. rectalis, R. gnavusについて、各96ウェルプレートから2-8個の単一細胞MDA産物を採取した。プールされたMDA産物をナノポアシーケンサーで個別に塩基配列を決定した。株ごとのLR-SAGは、最適化された条件下でscALAを用いて個別にアセンブルされた。A. hadrus 9株については、1桁のコンティグ番号を持つLR-SAGが得られ、A. hadrus 2株については、3.12 Mbp (A. hadrus G009c41) および 3.30 Mbp (A. hadrus G011c23) の単一の閉じたゲノム配列が手動足場なしに構築できた(補表 S5)。

キメラ配列を含む単細胞MDA産物から構築したA. hadrus LR-SAGのアセンブリ精度を評価するために、A. hadrus strain BPB5の既知の完全ゲノムに対するLR-SAGのアライメントをテストした。その結果、G012c17株のLR-SAGのみがBPB5株ゲノムと相同であることが示された(補足図S4)。他の株はBPB5ゲノムの1.7-2.2Mbの領域に大きな逆位を有していたが、この構造変異は8つのLR-SAGに共通していたため、ミスアセンブリの可能性は例外的に低いことが示された。SR-SAGでは、500kbpを超える大規模な逆行列は、主に10kbp以下の配列断片で構成されているため、検出が困難である。最後に、LR-SAGのコンティグと同一サンプルのscSRを研磨し、ギャップフィルすることによって、各株のcSAG(A. hadrus, R. gnavus, A. rectalisはそれぞれ9、4、3ゲノム)を構築し、以降の解析に用いた(Table 1)。

表1
www.frontiersin.org
表1. A. hadrus, A. rectalis, R. gnavusのcircular singleamplified genomes (cSAGs).

さらに、本研究で得られた cSAG と各生物種の既知の環状ゲノム(CP012098, NC012781, CP043051)からなる 3 種の細菌 のクローズドゲノムセットの解析を行った。クローズドゲノムセットを用いたパンゲノム解析の結果から、相同遺伝子位置に基づくゲノムアライメントを用いて、3種のゲノムプロットを作成した(図3A)。その結果、最大100kbp以上の複数の系統特異的な配列領域がゲノム全域で確認された。各細菌種のパンゲノム解析の結果、同居者間で共有されているA. hadrus株(G010c01-G011c23およびG012c40-G013c12-G015c54)は、宿主特異的A. hadrus株と比較して、固有遺伝子数が5倍少なく(図3B)、同居者間で腸内細菌を共有していることが浮き彫りにされた。各株ゲノムから得られた遺伝子配列をKyoto Encyclopedia of Genes and Genomes (KEGG; Aramaki et al., 2020) とVirus Orthologous Groups (VOG; Kieft et al., 2020) を用いて機能アノテーションした結果、ファージ様遺伝子は株固有の配列領域に著しく集中していることが確認された。VOGに注釈された遺伝子は、コア遺伝子よりもアクセサリー遺伝子やユニーク遺伝子に含まれる割合が高かった(pの値、アクセサリー対コア:0.042、ユニーク対コア:0.0081;図3C)。コアゲノムのグアニン・シトシン(GC)含量は単一のピークを示したが、ウイルス配列を含む株特異的領域のGC含量は複数の弱いピークを持ち、より広く分布していた(図3D)。

図3
www.frontiersin.org
図3. 腸内細菌円形単一増幅ゲノム(cSAG)の構造の比較。 A)A.hadrus、A.rectalis、R.gnavusのゲノムマップ。トラック1(外側)のタイルは、各菌株ゲノムにおける遺伝子クラスターの存在(緑色)または非存在を示す。トラック2は、遺伝子クラスターを含むゲノム数を示す折れ線グラフ(緑リボン:コア遺伝子、オレンジリボン:ユニーク遺伝子)。トラック 3 は、遺伝子クラスタのアノテーションをプロットしたもの(オレンジ色。トラック 3 は、遺伝子クラスターの注釈(オレンジ:Kyoto Encyclopedia of Genes and Genomes (KEGG) - annotated clusters、青:COG-annotated clusters)をプロットしたものです。トラック 3 は遺伝子クラスタの注釈をプロットしたものである(橙:Kyoto Encyclopedia Gen and Genom (KEGG) 注釈クラスタ、青:COG 注釈クラスタ、灰:注釈なし)。トラック4はGC含有量の線図(緑:高GC領域、オレンジ:低GC領域)。(B)cSAGと参照ゲノムにおける相同遺伝子クラスター数。cSAGごとに、コア相同遺伝子(OG;青)、アクセサリーOG(緑)、ユニークOG(赤)のコーディング配列(CDS)数を示す。ハイライトされたラベルは宿主を示し、色のついた星印は同居人から得られた近縁種ゲノムを示す。(C) ウイルスオーソログループ(VOG)注釈付きCDSが、株特異的なアクセサリーまたはユニークカテゴリーに集積されている。(D)3種の細菌ゲノムを株特異的配列領域と株共通配列領域に分割したGC含量分布。

2.5. 円形単一増幅ゲノムで観察された菌株特異的構造変異の代謝解析
得られたcSAGを用いた代謝解析を行い、構造変異が細菌の形質に与える影響を検討した。機能性遺伝子モジュールのスクリーニングにより、CAZy (Carbohydrate-Active enZymes)、CRISPR (Clustered regularly interspaced short palindromic repeats) および特定の機能に関連する遺伝子モジュールの有無に菌株特異的な違いが見られた(図4A)。CAZyプロファイルから、ある株は同じ細菌種の他の株と比較して、より多様な糖質の代謝能力を有していることが示された。例えば、A. hadrus cSAGセットのG004c06株にのみアモルファスセルロース、β-マンナン、キシラン、キシログルカンの代謝能が検出され、G006c13、G012c40、G013c12、G015c54株のみラムノース代謝能が確認された。

図4
www.frontiersin.org
図4. 腸内細菌円形単一増幅ゲノム(cSAG)の代謝解析。 A)各株のゲノムに含まれる様々な糖質活性酵素(CAZy)またはCRISPR-Cas系を示すヒートマップ。ハイライトされたラベルは宿主を、色のついた星は同居人から得られた近縁種ゲノムを示す。(B) A. hadrusゲノムの多糖類代謝経路の構造変異。同じ領域の遺伝子クラスターはアラインメントされている。左の系統図は、全ゲノムに存在するオルソグループのパターンから推定したものである。

ラムノース代謝に関連する遺伝子モジュールの存在は、A. hadrus cSAGsを用いて可視化された(図4B)。イノシトール代謝系は、ヒト腸内細菌叢のショットガンメタゲノムデータを用いたコホート研究(Zeevi et al., 2019)で注目された腸内細菌代謝系で、A. hadrusゲノムにおけるイノシトール代謝遺伝子モジュールの有無は、宿主体重や代謝疾患リスクと相関があると示唆されました。上記の研究では、メタゲノミックリードを細菌ゲノムのデータベースにマッピングし、リード深度の違いから可変型および欠失型構造変異を検出しましたが、そのメタゲノミックデータセットの約40%でA. hadrusのすべてのイノシトール代謝遺伝子が欠失されていました。一方、本研究の結果では、A. hadrusのイノシトール代謝系全体の有無だけでなく、遺伝子再配列や機能遺伝子の部分欠失など、より多様な構造変異が確認された(図4B)。また、ラムノース代謝系解析のように、既知のA. hadrus BPB5ゲノムでは欠損しているため、マッピングによる評価では挿入遺伝子の配列が検出できないことが判明した。

各ゲノムにおけるCRISPRアレイの数は、A. hadrus、A. rectalis、R. gnavusでそれぞれ2-7、2-4、0-1座とばらつきがあった(図4A)。A. hadrusゲノムはCRISPR-Casシステムの保有パターンにより5つのタイプに分類され、CRISPR-Casシステム近傍のトランスポザーゼ遺伝子は、これらのシステムが水平方向に移動したことを示唆するものであった。また、A. hadrusゲノムの同じ領域には同じタイプのCRISPR-Cas系が配置されており、各CRISPR-Cas系は後天的に同じ祖先株から受け継がれたことが示唆された。興味深いことに、CRISPRアレイ配列は高い系統特異性を示した。

2.6. Anaerostipes hadrusのゲノム構造動態の追跡
A. hadrus G011c23を含む糞便サンプルの採取から合計9ヶ月後、同じ宿主から再度糞便サンプルを採取し、SAG-gelプラットフォームを用いてA. hadrusのSR-SAGを7個取得した。新たに得られたA. hadrus G001c10株のSR-SAGは、G011c23株のSR-SAGと99.5%以上のANIを示したため、経時的に生じたゲノム構造変化を検討した。A. hadrus G001c10 SR-SAGから構築したCSR-SAGをA. hadrus G011c23と比較した。G001c10 CSR-SAGは、G011c23 cSAGの2.3 Mbpに相当する位置に、20kbpの欠失(図5A)と12kbpの挿入(図5B)を含む50kbpの非常に多様なゲノム領域が存在していた。挿入領域の両端にはプロファージ配列であることを示す繰り返し配列の痕跡が観察されたが(図5B)、繰り返し配列の相同性が低いことから、検出された構造変異は過去9ヶ月より前に生じたものであると考えられた。このG001c10株の高度に多様な領域は、G011c23株の近縁の宿主から得られたG010c01株ゲノムの配列構造と類似していた(図5A)。さらに、G011c23とG001c10にのみ共通する配列構造が確認されたため、G010c01、G011c23、G001c10の3株は別個の株であると考えられる。オルソログ(OG)解析の結果、G001c10株はG010c01株やG011c23株(それぞれ169と226)に比べて特異的OGが著しく少なく(28)、G001c10株はG010c01およびG011c23株と中間のゲノム相同性を持つことが分かった(図5C)。また、個々のSAGにおいても構造の違いが検出され、各サンプルあるいは各サンプリング時刻において、単一の株が支配的であったことが示唆された。16S rDNA 遺伝子などの既存のマーカー配列を含む 3 株のゲノム配列は、関連する構造変異領域を除けば非常に類似しており、優占する A. hadrus 株の変異は包括的 scLR シーケンスを用いて新たに検出されたものであることが示唆された。

図5
www.frontiersin.org
図5. 同一宿主または同居者から異なる時点で得られたA. hadrus株SAGにおける株間ゲノム構造変異。(A) 各株のCSR-SAGとA. hadrus G01c23. G011c23、G001c10は同一宿主由来、G010c01株は同宿者由来。ヒートマップ上部の三角形は、3つのA. hadrus株を比較した際に検出されたSNPを示す(赤色。赤:G001c10-G010c01共通塩基、緑:G001c10-G011c01共通塩基。G001c10-G011c23共通ヌクレオチド)。詳細図はSR-SAGマッピングの結果を生で示したもので、G001c10ゲノムではG011c23ゲノムと比較してG010c01様の欠失があることが示されている。(B)G001c10ゲノムのG010c01様挿入領域とG011c23ゲノムの遺伝子マップとドットプロット。(C)3つのA. hadrus株のゲノムにおける相同遺伝子クラスターのベン図。

  1. 3.考察
    未培養環境細菌の特性を研究するためには、複数の菌株から正確かつ完全な標的細菌ゲノムを取得することが重要である。ロングリードシーケンスとそれに伴う解析技術の進歩により、培養株やメタゲノムから円形の細菌ゲノムを組み立てることが可能になったが、未培養細菌の単細胞MDA産物とロングリードシーケンスを組み合わせて完全な細菌ゲノムを得るのは困難であった。この困難の理由の一つは、全ゲノム増幅反応時に単細胞ゲノムが均一に増幅されないため、低頻度で増幅されるゲノム領域がアセンブルされたドラフトゲノムから見逃されることであった。本研究では、scALAを用い、円形のヒト腸内細菌SAGを取得した。特に、既存のゲノムアセンブルアルゴリズムの反復とscLRシーケンスを用いたマッピングベースのデバイアシングにより、SAGを構築した。

scALAを用いて未培養細菌のcSAGを構築するためには、高いレベルのゲノム品質を示す同一細菌株由来の複数の単一細胞MDA産物が必要である。個々のSAGのゲノム完全性が100%に達することはほとんどなく、ほとんどのSAGのゲノム完全性は40-60%であるため、全ゲノム情報を網羅するには、複数の単一細胞MDA産物のプールサンプルのロングリード配列決定が必要である。さらに、各単細胞MDA産物でランダムに生成されるキメラ配列は、我々の先行研究(Kogawa et al., 2018)で示したように、プールされた配列データから検出・除去することが可能である。十分なSAGデータの統合により、単細胞MDA産物からの高品質な複合ゲノムの取得が可能となる。しかし、MDA由来のシーケンシングバイアスを効率的に低減するためにSAGをプールし、混合比を決定する際には、ショートリードのシーケンシング結果において各SAGが示すゲノムの完全性と増幅バイアスを考慮する必要がある。しかし、従来のシングルセルシーケンスでは、ゲノムの質の低さ、ランニングコストの高さ、実験操作の複雑さなどから、複数の特定株SAGを取得することは困難であった。本研究では、費用対効果の高いハイスループットなシングルセルシーケンスSAG-gelプラットフォーム(Chijiiwa et al., 2020; Arikawa et al., 2021; Hosokawa et al., 2022)を用いて、数百のSR-SAGと複数のLR-SAGをscalabに求められる品質で容易に取得することができました。

A. hadrus、A. rectalis、R. gnavusのcSAGを比較ゲノム解析したところ、配列されたゲノム領域では高い相同性を示しながら、株固有の構造変異があることが明らかになりました。この菌株固有の構造変異は、16S rRNA遺伝子アンプリコンシーケンスやショートリードメタゲノムシーケンスリードを既知の参照ゲノムにマッピングするなどの従来のメタゲノム手法では検証することが困難である可能性があります。糖代謝系、CRISPR-Cas系、合成べん毛モジュールなどの遺伝子セットの有無など、個々の細菌株の表現型を決定する上で、構造的変異は非常に重要である(補足表S6)。さらに、CRISPR-Casシステムを解析することで、従来のマーカー遺伝子解析よりも正確にA. hadrusの進化や分布を明らかにできる可能性があることが示された。近年、円形細菌ゲノムを構築するためのメタゲノム長尺シーケンスが報告されているが、従来の長尺リード配列の精度やアセンブリアルゴリズムでは、近縁の細菌種からのメタゲノム配列のビン化は困難な場合が多い(Moss et al.、2020年)。したがって、シングルセルゲノムシーケンスを用いて、特にターゲットとする腸内細菌種の円形ゲノムを得ることは、細菌の特徴づけやそのゲノムにおける特定の構造変異や遺伝子セットの検出に役立つと思われる。

本研究でゲノムを取得したAnaerostipes hadrusは、宿主の健康に関連する腸内細菌候補として注目されている(Zeevi et al.、2019)。腸内細菌に関する研究は数多く行われており、腸内細菌ゲノムデータベースは拡大しつつある(Almeida et al.、2021)。これらの研究からは、特定種の代表的なゲノム配列と地理的に特異的なゲノムの特徴の両方を調査することの重要性も示唆されている。本研究では、A. hadrusゲノムの配列類似性は必ずしもオーソログ機能遺伝子の存在と相関しないことを確認したが、宿主の地理的地域性は遺伝子保有に大きく関係しているようであった。一方、A. rectalisゲノムでは配列類似度、遺伝子保有量、宿主の地理的位置と高い相関があり、これは1,300以上のA. rectalisゲノムを用いた大規模比較解析(Karcher et al., 2020; 補足図S5)と一致した。この結果から、腸内細菌の機能予測には地理的地域ごとのタイプ株ゲノムの蓄積が不可欠であり、株分類の適切な地理的解像度は細菌種に依存することが示唆された。

A. hadrus G001c10 ゲノムには、9ヶ月前に採取した2株(同一宿主由来のG011c23株と同居者由来のG010c01株)のゲノムに含まれていた配列が混在していた。構造変異やSNPの位置から、G001c10ゲノムはG010c01とG011c23のゲノムからなる部分キメラゲノムを有していることがわかった(図5A)。したがって、G001c10株の出現は、G010c01ゲノムとG011c23ゲノムの相同組換えによって引き起こされた可能性がある。さらに、A. rectalis G004c08 と R. gnavus G008c02 のゲノムが9ヶ月後に得られたが、それらの構造はほとんど変化しなかった(データは示さず)。これらの結果は、A. hadrusゲノムの構造変化が他の腸内細菌と比較して高い頻度で起こり、その結果、配列相同性と遺伝子パターンの相関が失われていることを示している。

シングルセルゲノムシーケンスでは、一般的に全ゲノム増幅に起因するキメラ配列(Bankevich et al, 2012)と増幅バイアス(Nishikawa et al, 2015)という2つの主要な課題が存在します。そこで、これらの課題を解決しつつ、scLR配列を環状SAGにde novoアセンブルするためにscALAを開発しました。scALAを用いたscLR配列決定を行うことで、ヒト、土壌、海洋、その他極地環境における未培養細菌の完全な円形ゲノムを得ることができ、ゲノム構造変異を評価することが可能になります。プロモーター領域や遺伝子配列の逆転など、このような構造的バリエーションは、遺伝子発現や表現型を変化させる可能性があります(Guérillot et al.) さらに、完全なゲノムの取得は、全長プロファージ配列の発見や細菌-ファージ相互作用の解明を促進する(Marbouty et al.、2021)。今回の結果は、過去に複数の宿主特異的なファージ感染から株特異的なゲノム領域が生じたことを示唆している。さらに、本研究は、種内における遺伝子モジュールの変化を同定し、細菌の代謝形質との関係を理解するために、株分解された細菌ゲノムを継続的に蓄積することの重要性を強調している。我々の手法は、既知の参照ゲノムに基づくメタゲノム解析では困難な、新規遺伝子や構造変異を同定するための未培養株ゲノム比較の能力を拡大する(Zeevi et al.、2019)。私たちが開発した技術は、単一の未培養細菌細胞の閉じたゲノムを用いて未知の細菌ゲノムを同定し、種内多様性の理解を深めることができます。

  1. 手法の紹介
    4.1. 実験計画および試料採取
    参加者は書面によるインフォームドコンセントに署名し、早稲田大学倫理審査委員会は本研究を承認している(No.2018-323)。使用したすべての方法は、倫理委員会がまとめた指針および規則に従って実施された。参加者は新鮮な糞便を3mlのチオシアン酸グアニジン(GuSCN)溶液(株式会社テクノスルガ研究所)を含む15mLバイアルに採取し、サンプルを25℃で最大2日間保存してからドロップレットに単細胞カプセル化した。

培養細胞のモデル解析には、Escherichia coli strain K-12 (ATCC 10798, genome size: 4.6 Mbp)を用いた。大腸菌K-12株をLuria-Bertani培地で16時間前培養し、遠心分離により細胞を回収した。回収した細胞は、紫外線処理したダルベッコリン酸緩衝生理食塩水(DPBS, Thermo Fisher Scientific)で3回洗浄した。

4.2. シングル増幅ゲノムゲルプラットフォームを用いたシングルセルゲノムシークエンス
シングルセルゲノム増幅は、我々の以前の報告(Chijiiwa et al., 2020; Nishikawa et al., 2022)に従い、SAG-gelプラットフォームを用いて行った。腸内細菌解析は、ヒト糞便をリン酸緩衝生理食塩水(PBS)またはGuSCN溶液(500μl)でホモジナイズした後、2000×gで30秒間遠心分離して上清を回収し、35μmのナイロンメッシュでろ過して8000×gで5分間遠心分離をした。得られた細胞ペレットをPBSに再懸濁し、8,000×gで5分間、2回遠心分離を行った。

単一細胞カプセル化の前に、細胞懸濁液をPBS中の1.5%アガロースで0.1細胞/ドロップレットに調整し、単一ドロップレットに複数の細胞がカプセル化されることを防いだ。On-chip Droplet Generator (On-chip Biotechnologies Co., Ltd) を用いて,キャリアオイルである2% Pico-Surf 1 in Novec 7,500 (Dolomite Microfluidics) に浮かぶ液滴に単一細菌細胞をカプセル化し,氷上で15分間冷却してゲルマトリックスを形成し1.5 mL チューブに回収した.固化後、集めた液滴を1H,1H,2H,2H-パーフルオロ-1-オクタノール(Sigma-Aldrich)で破り、カプセルを回収した。このゲルカプセルを500μlのアセトン(富士フイルム和光純薬)で洗浄し、この溶液を激しく攪拌し、2,000×gで10秒間遠心分離した。アセトン上清を除去し、500μlのイソプロパノール(富士フイルム和光純薬)を加え、再び激しく混合し、2,000×gで10秒間遠心分離した後、イソプロパノール上清を除去し、500μlのDPBSで3回洗浄し、ゲルカプセルを得た。

その後、ビーズ内の個々の細胞を、溶解液にゲルビーズを浸すことによって溶解した:第1溶液、50U/μL Ready-Lyse Lysozyme Solution (Lucigen), 2 U/ml Zymolyase (Zymo Research Corporation), 22 U/mL lysostaphin (Sigma-Aldrich), 250 U/ml mutanolysin (Sigma-Aldrich) in DPBS at 37°C overnight; 第2溶液、0. 5 mg/ml アクロモペプチダーゼ(富士フイルム和光純薬株式会社)、DPBS中、37℃で6-8時間;および第3溶液、1 mg/ml Proteinase K(プロメガ株式会社)、DPBS中0.5 % SDS、40℃で一晩。大腸菌の実験では、ライシスステップを省略した。試薬の交換ごとに、ゲルビーズをDPBSで3回洗浄し、次の溶液に再懸濁した。溶解後、ゲルビーズをDPBSで5回洗浄し、上清を除去した。その後、Buffer D2(変性バッファー)に懸濁し、REPLI-g Single Cell Kit(QIAGEN)を用いてMDA反応に供した。

30℃、2時間、65℃、3分のMDAの後、ゲルビーズを500μlのDPBSで3回洗浄した。その後、DPBS中の1×SYBR Green (Thermo Fisher Scientific)でビーズを染色した。ゲル内の緑色蛍光の有無からDNA増幅を確認した後、蛍光陽性ビーズを488nm励起レーザーを備えたBD FACSMelodyセルソーター(BD Bioscience)を用いて96ウェルプレートのDPBS 0.8 μl中にソーティングした。液滴ソート後、96ウェルプレートは第2ラウンドのMDAに進むか、˗30℃で保存された。

96-well プレートでのゲルビーズ回収後、REPLI-g Single Cell Kit を用いて 2 回目の MDA を実施した。Buffer D2 (0.6 μL)を各ウェルに添加し、65℃で10分間インキュベートした。その後、8.6μlのMDA混合液を加え、30℃、120分間インキュベートした。MDA反応は65℃で3分間加熱して終了させた。2回目の増幅後、単細胞MDA産物のマスターライブラリープレートを作成した。品質管理のため、単細胞MDA産物のアリコートをレプリカプレートに移し、Qubit dsDNA High Sensitivity Assay Kit(Thermo Fisher Scientific)を用いたDNA収量の定量に使用した。

4.3. ショートリードシーケンス
QIAseq FX DNA Library Kit (QIAGEN)を用いて、2回目のMDA産物からscSRライブラリを調製し、シークエンス解析に供した。ライゲーションアダプターはTruSeq-Compatible Full-length Adapters UDI (Integrated DNA Technologies, Inc)に変更した。各SAGライブラリーは、Illumina HiSeq 2×150 bp構成(Macrogen)を用いて配列決定した。

さらに、fastp 0.20.0 (Chen et al., 2018b; option: -q 25-r -x)で品質管理したscSRをSPAdes 3.14.0 (SAG 用オプション: --sc --careful --disable-rr --disable-gzip-output -t 4 -m 32) で SR-SAG にデノボアセンブリし、1000bp未満のコンティグはその後の分析から除外した (Bankevich et al., 2012).CheckM v1.1.2 (Parks et al., 2015)を用いて、完全性が10%以上、汚染が10%未満のSR-SAGsを選択した。選択されたSR-SAGsについて、FastANI 1.3 (Jain et al., 2018)を用いてANIを算出した。CheckM分類ワークフロー(オプション:--nt --tab_table -t 16 domain Bacteria)を用いて得られた共通の1コピーマーカー遺伝子の相同性を、デフォルトオプションでblastn 2.9.0+ (Camacho et al., 2009)を用いて計算した。個々の宿主データセットから、ANIが95%以上、1コピーマーカー遺伝子の相同性が99%以上、4塩基頻度相関 (Teeling et al., 2004) が90%以上のSAGを同一菌株群に分類した。株群のSR-SAGは、ccSAGによるキメラ除去・共集合を用いてCSR-SAGに統合した(Kogawa et al.,2018)。特に断りのない限り、解析ツールはデフォルトのパラメータで実行した。

4.4. ロングリードシーケンスと標準的なde novoアセンブリ
Rapid Sequencing Kit(Oxford Nanopore Technologies)を用いて個々の単細胞MDA産物またはプールした複数の単細胞MDA産物からscLRライブラリを作成し、Flow Cell R9.4 でGridION(Oxford Nanopore Technologies)を用いてシーケンスした。大腸菌モデルサンプルの場合、5つの大腸菌2回目MDA産物からscLR(300 Mbp)を取得し、1つのファイルに統合しました。

糞便細菌サンプルの場合、CSR-SAGを用いて同定した菌株をもとに96ウェルプレートから糞便細菌の第2ラウンドMDA産物を選択し、単一のシーケンスライブラリーとしてプール(1菌株あたり2-8 SAG)し、ナノポアシーケンサーを用いてscLRシーケンスした。

de novoアセンブリには、miniasm 0.3 (Li, 2016; using paf file output by minimap2 2.17 (Li, 2018) with "-x ava-ont" option) or, Canu 1.9 (Koren et al., 2017; -nanopore-raw), Flye 2.7 (Kolmogorov et al., 2019; --nanopore-raw) with 4.6 Mb genome size optionを用いてsCRNのLR-SAGsへのアセンブリに使用しました。キメラ除去されたロングリードのMiniasmおよびFlyeアセンブリは、Canuが出力した「trimmedReads」ファイルを用いて実施した。LR-SAGの品質評価は、QUAST 5.0 (Gurevich et al., 2013) と CheckM (上記と同じオプション) を用いて行った。ドラフトゲノムと参照大腸菌ゲノムのアライメント結果は、D-GENIES 1.2.0 (Cabanettes and Klopp, 2018)を用いて可視化した。特に断りのない限り、解析ツールはデフォルトのパラメータで実行した。

4.5. 単一細胞増幅ゲノムロングリードアセンブリを用いたLR-SAGアセンブリ
NanoFilt (De Coster et al., 2018; options: "-q 10 -l 1000 --headcrop 75)" を用いて入力scLRから最初の75塩基を除去した後、<1,000 bpまたは平均品質スコア<10の低品質scLRを削除した。その後、入力scLRのde novoアセンブリにより、scLR debiasingの参照として中間コンティグを構築した。scALAにおけるすべてのアセンブリは、Canu 1.9 (Koren et al., 2017) を用いたキメラ配列のトリミングと、Flye 2.7 (Kolmogorov et al., 2019) を用いた scLRs の de novo アセンブリによって行われました。アセンブリーでは、Canuで「-nanopore-raw saveReads = true stopAfter = trimming」でキメラ除去を行い、「trimmedReads」ファイルを「--nano-corr」オプションでFlyeアセンブルを行った。両アセンブラーのゲノムサイズオプションは、同一菌株のCSR-SAGsの全長を指定した。その後、scLRsのデバイズを行った。入力されたscLRは、minimap2 2.17 (Li, 2018)を用いて、組み立てられた中間参照コンティグに対してマッピングされた。マッピングされた深さに応じて偏った配列を特定し、JVarkitのbiostar154220.jar(Lindenbaum, 2015)を用いて50×配列深さとなるように入力scLRの過剰数を除去した。平均深度が50×に満たない場合でも、50×深度を超える部分についてはリードサブサンプリングを行った。バイアス低減したscLRを用いて再集合することで、第1回参照コンティグよりもゲノム領域を網羅した第2回参照コンティグを構築し、次のデバイアスステップに進む。再組立したコンティグの全長に変化がなければ、組立・デバイアスのサイクルを停止し、本研究では組立・デバイアスの工程を4回繰り返した。次に、コンティグ数が最も少ない代表的な中間参照コンティグを足場にして、コンセンサス配列を構築した。スキャフォールディングには、代表的な参照コンティグと他の参照コンティグとのBLASTアライメント結果およびMulti-CSAR (Chen et al., 2018a) を使用した。scaffolding後、同じMDA産物から得られたscSRを用いて、Pilon 1.22 (Walker et al., 2014)を用いて配列を研磨した。配列の研磨後、株特異的なLR-SAGを得た。糞便細菌ゲノム配列の場合、A. hadrus, R. gnavus, A. rectalisのclosed cSAGは、同じ単細胞MDA産物のSR-SAGでLR-SAGコンティグをギャップフィリングして構築された。SR-SAGはBlastによりLR-SAGにアライメントされ、SR-SAGコンティグがカバーするギャップ領域の "N "が置換された。特に断りのない限り、解析ツールはデフォルトのパラメータで実行した。

4.6. 比較ゲノム解析
Roary (Page et al., 2015; options: -n -e) を用いて、NCBI ゲノムデータベースの参照ゲノムを用いたパンゲノム解析を行った。株のクラスタリングは、相同遺伝子群の存在に基づくUMAP解析(Ems and Kelly, 2019)を用いて実施した。ゲノムの距離行列は、マンハッタン法を用いて生成し、Rパッケージumap 0.2.7 (McInnes et al., 2018) を用いて、各図に対応する「n_neighbors」オプションで可視化した。系統解析には、Roary解析工程でMAFFT 7.245 (Katoh and Standley, 2013) のコア遺伝子アライメント結果からRAxML-NG 0.9.0 (Kozlov et al., 2019; options: --model GTR) を用いてSNPベースの木を最尤法で作成した。木はiTOL 6.4.3 (Letunic and Bork, 2021)を用いて図示した。

LR-SAGのゲノムアライメント結果は、D-GENIES1.2.0 (Cabanettes and Klopp, 2018) またはCircos 0.69 (Krzywinski et al., 2009) を用いて細菌ゲノム構造変異解析のために可視化された。また、Prokka 1.14.5 (Seemann, 2014; options: --compliant) を用いて抽出したコーディング配列(CDS)に対して、KofamScan (Aramaki et al., 2020) を用いたKEGGアノテーション、VIBRANT 1.2.1 (Kieft et al., 2020) を用いたVOGアノテーションを実施しました。VOG遺伝子保有のt検定はRで行い、遺伝子モジュールはgenoPlotR (Guy et al., 2010)を用いてプロットした。パスウェイ解析はDRAM 1.0.6 (Shaffer et al., 2020)、CRISPR検出はCRISPRDetect 2.4 (Biswas et al., 2016)をそれぞれ用いて実施した。糖質活性酵素(CAZy)の有無は、DRAMの解析結果から可視化した。特に断りのない限り、解析ツールはデフォルトのパラメータで実行した。

データの利用可能性に関する記述
本研究で紹介したデータセットは、オンラインリポジトリで見ることができる。リポジトリ/レポジトリの名前とアクセッション番号(複数可)は、https://www.ncbi.nlm.nih.gov/、PRJNA818799およびPRJNA692334で見つけることができます。scALAパイプラインはGithub (https://github.com/mstkgw/scALA)で公開されています。

倫理に関する声明
ヒトを対象とした研究は、早稲田大学の倫理審査委員会の審査を受け、承認されています。本研究に参加するための書面によるインフォームドコンセントは、参加者の法的保護者/近親者から提供されました。

著者による貢献
MKとMHは実験の企画・立案、全データの解析、原稿の執筆を行った。ロングリードシングルセルシーケンスの開発には、MK、YN、HT、MHが参加した。また、MK、TS、TYは、ゲノム実験とデータ収集を行った。MK と KA は、シングルセルゲノムデータのバイオインフォマティクス解析を行った。最終原稿は全著者が確認し、承認した。

資金提供
本研究の一部は、JSTさきがけ(助成番号JPMJPR15FA)および文部科学省科研費(助成番号21H01733および19K22089)の支援を受けて実施したものである。

謝辞
東京大学ヒトゲノム解析センターよりスーパーコンピュータの提供を受けた。

利益相反
MHとHTは、bit-MAPと同じSAG-gelワークフローを用いたシングルセルゲノミクスサービスを提供するbitBiome, Inc.の株主である。MHはbitBiome, Inc.の創設者である。MK、TS、TY、KAはbitBiome, Inc.に在籍しています。MK、MH、YN、KA、HTは、bitBiome社が提出したシングルセルシーケンス技術に関する特許出願の発明者である。

出版社からのコメント
本論文で述べられたすべての主張は、著者個人のものであり、必ずしも所属機関、出版社、編集者、査読者のものを代表するものではありません。本論文で評価される可能性のある製品、またはそのメーカーによる主張は、出版社によって保証または是認されるものではありません。

補足資料
本論文の補足資料は、https://www.frontiersin.org/articles/10.3389/fmicb.2023.1133917/full#supplementary-material に掲載されています。

参考文献
Almeida, A., Nayfach, S., Boland, M., Strozzi, F., Beracochea, M., Shi, Z. J., et al.(2021年)。ヒト腸内細菌群の204, 938の参照ゲノムの統一カタログ。Nat. Biotechnol. 39, 105-114. doi: 10.1038/s41587-020-0603-3

PubMed Abstract|CrossRefフルテキスト|Google Scholar

荒巻 崇、Blanc-Mathieu, R.、遠藤 浩、大久保 圭、金久 正、後藤 聡、他 (2020). Kofam KOALA: プロファイルHMMと適応的スコア閾値に基づくKEGGオルソログの割り当て. バイオインフォマティクス 36, 2251-2252.doi: 10.1093/bioinformatics/btz859

PubMed Abstract|CrossRef Full Text|Google Scholar

有川和彦・井手和彦・粉川雅史・佐伯俊哉・依田拓也・遠藤哲郎・他(2021). シングルセルゲノミクスとメタゲノミクスの統合フレームワークによるヒトマイクロバイオームからの菌株分解ゲノムの復元. マイクロビオーム 9:202.

PubMed Abstract|CrossRef Full Text|Google Scholar

このような、微生物に関連する様々な情報を収集することができます。SPAdes: 新しいゲノムアセンブルアルゴリズムとそのシングルセルシーケンスへの応用。J. Comput. Biol. 19, 455-477.

PubMed Abstract|CrossRef Full Text|Google Scholar

Bertrand, D., Shaw, J., Kalathiyappan, M., Ng, A. H. Q., Kumar, M. S., Li, C., et al. (2019). ハイブリッドメタゲノムアセンブリにより、ヒトマイクロバイオームにおける耐性決定因子と可動要素の高分解能解析が可能になった。Nat. Biotechnol. 37, 937-944. doi: 10.1038/s41587-019-0191-2

PubMed Abstract|CrossRef Full Text|Google Scholar

Biswas, A., Staals, R. H. J., Morales, S. E., Fineran, P. C., and Brown, C. M. (2016). CRISPR detect: a flexible algorithm to define CRISPR arrays. BMC Genomics 17:356. doi: 10.1186/s12864-016-2627-0

PubMed Abstract|CrossRef Full Text|Google Scholar

Bowers, R. M., Kyrpides, N. C., Stepanauskas, R., Harmon-Smith, M., Doud, D., Reddy, T. B. K., et al (2017). 細菌と古細菌の単一増幅ゲノム(MISAG)およびメタゲノム集合ゲノム(MIMAG)に関する最小限の情報。Nat. Biotechnol. 35, 725-731. doi: 10.1038/nbt.3893.

PubMed Abstract|CrossRef Full Text|Google Scholar

Cabanettes, F., and Klopp, C. (2018). D-GENIES: dot plot large genomes in an interactive, efficient and simple way.(D-GENIES:大規模ゲノムをインタラクティブかつ効率的でシンプルな方法でドットプロットする。PeerJ 6:e4958. doi: 10.7717/peerj.4958.

PubMed Abstract|CrossRefフルテキスト|Google Scholar

このような場合、「BLAST+」が有効です。BLAST+: アーキテクチャとアプリケーション. BMCバイオインフォマティクス10:421.doi: 10.1186/1471-2105-10-421

PubMed Abstract|CrossRef Full Text|Google Scholar

Chen, K.-T., Shen, H.-T., and Lu, C. L. (2018a). Multi-CSAR: a multiple reference-based contig scaffolder using algebraic rearrangements. BMC Syst. Biol. 12:139. doi: 10.1186/s12918-018-0654-y

PubMed Abstract|CrossRef Full Text|Google Scholar

Chen, S., Zhou, Y., Chen, Y., and Gu, J. (2018b). Fastp: an ultra-fast all-in-one FASTQ preprocessor. バイオインフォマティクス 34, i884-i890. doi: 10.1093/bioinformatics/bty560

PubMed Abstract|CrossRef Full Text|Google Scholar

千々岩亮, 細川雅彦, 粉川雅彦, 西川祐史, 井手和彦, 坂梨千恵子, 他 (2020). 未培養菌のシングルセルゲノミクスにより、マウス腸内細菌叢の食物繊維レスポンダーが明らかになった。Microbiome 8:5. doi: 10.1186/s40168-019-0779-2

PubMed Abstract|CrossRefフルテキスト|Google Scholar

De Coster, W., D'Hert, S., Schultz, D. T., Cruts, M., and Van Broeckhoven, C. (2018). NanoPack: Long-read sequencing dataの可視化と処理。バイオインフォマティクス 34, 2666-2669. doi: 10.1093/bioinformatics/bty149

PubMed Abstract|CrossRef Full Text|Google Scholar

Emms, D. M., and Kelly, S. (2019). OrthoFinder: 比較ゲノミクスのための系統的オーソロジー推論。ゲノムバイオロジー 20:238. doi: 10.1186/s13059-019-1832-y

PubMed Abstract|CrossRefフルテキスト|Google Scholar

Guérillot, R., Kostoulias, X., Donovan, L., Li, L., Carter, G. P., Hachani, A., et al. (2019). 黄色ブドウ球菌の不安定な染色体再配列は、持続的な感染に関連する表現型の切り替えを引き起こす。Proc. Natl. Acad. Sci. U. S. A. 116, 20135-20140. doi: 10.1073/pnas.1904861116

PubMed Abstract|CrossRef Full Text|Google Scholar

Gurevich, A., Saveliev, V., Vyahhi, N., and Tesler, G. (2013). QUAST: ゲノムアセンブリのための品質評価ツール。バイオインフォマティクス 29, 1072-1075.

PubMed Abstract|CrossRef Full Text|Google Scholar

GenoPlotR: comparative gene and genome visualization in R. Bioinformatics 26, 2334-2335.

PubMed Abstract|CrossRef Full Text|Google Scholar

Henke, M. T., Kenny, D. J., Cassilly, C. D., Vlamakis, H., Xavier, R. J., and Clardy, J. (2019). クローン病に関連するヒト腸内細菌群のメンバー、炎症性多糖類を産生する。Proc. Natl. Acad. Sci. U. S. A. 116, 12672-12677. doi: 10.1073/pnas.1904099116

PubMed Abstract | CrossRef Full Text | Google Scholar

細川雅彦、遠藤哲郎、鎌田和彦、有川和彦、西川祐子、粉川雅彦、他(2022). 選択的シングルセルゲノムシーケンスによる生存可能な微生物群集の菌株レベルプロファイリング。Sci. Rep. 12, 1-12. doi: 10.1038/s41598-022-08401-y

クロスレフフルテキスト|Google Scholar

井手和彦・佐伯俊哉・有川和彦・依田俊哉・遠藤哲郎・松橋明彦・他 (2022). シングルセルゲノムシーケンスを用いたヒト皮膚優勢菌種の菌株多様性の探索。Front. Microbiol. 13:955404.

PubMed Abstract|CrossRef Full Text|Google Scholar

Jain, C., Rodriguez, R. L. M., Phillippy, A. M., Konstantinidis, K. T., and Aluru, S. (2018).を参照。90K原核生物ゲノムのハイスループットANI解析により、明確な種の境界が明らかになった。Nat. Commun. 9:5114. doi: 10.1038/s41467-018-07641-9

PubMed Abstract|CrossRef Full Text|Google Scholar

Karcher, N., Pasolli, E., Asnicar, F., Huang, K. D., Tett, A., Manara, S., et al.(2020)。メタゲノムから得られた1321のEubacterium rectaleゲノムの解析により、複雑な系統地理学的集団構造と亜種の機能適応が明らかになった。Genome Biol. 21:138. doi: 10.1186/s13059-020-02042-y

PubMed Abstract | CrossRef Full Text | Google Scholar

加藤和彦・スタンレー・D.M. (2013). MAFFTマルチプルシーケンスアライメントソフトウェアバージョン7:性能と使いやすさの向上。Mol. Biol. 30, 772-780.

PubMed Abstract|CrossRefフルテキスト|Google Scholar

Kieft, K., Zhou, and Anantharaman, K. (2020). VIBRANT: Automated recovery, annotation and curation of microbial viruses, and evaluation of viral community function from genomic sequences(微生物ウイルスの自動回収、アノテーション、キュレーション、ゲノム配列からのウイルス群集機能の評価)。Microbiome 8:90. doi: 10.1186/s40168-020-00867-0

PubMed Abstract|CrossRef Full Text|Google Scholar

小川真由美・細川真由美・西川陽子・森健太郎・竹山裕之 (2018). 単細胞増幅ゲノムの洗浄・共集合による未培養微生物からの高品質ドラフトゲノムの取得. サイエンス・リップ 8:2059.

PubMed Abstract|CrossRefフルテキスト|Google Scholar

Kolmogorov, M., Yuan, J., Lin, Y., and Pevzner, P. A. (2019). リピートグラフを用いた、長くてエラーが起こりやすいリードのアセンブリ。Nat. Biotechnol. 37, 540-546. doi: 10.1038/s41587-019-0072-8

PubMed Abstract|CrossRef Full Text|Google Scholar

Koren, S., Walenz, B. P., Berlin, K., Miller, J. R., Bergman, N. H., and Phillippy, A. M. (2017).を参照してください。Canu: adaptive k-mer weighting and repeat separationによるスケーラブルで正確なロングリードアセンブリ。ゲノム・リサーチ 27, 722-736.doi: 10.1101/gr.215087.116

PubMed Abstract|CrossRef Full Text|Google Scholar

Kozlov, A. M., Darriba, D., Flouri, T., Morel, B., and Stamatakis, A. (2019). RAxML-NG: a fast, scalable and user-friendly tool for maximum likelihood phylogenetic inference(RAxML-NG:最尤系統推算のための高速でスケーラブルで使いやすいツール)。バイオインフォマティクス 35, 4453-4455. doi: 10.1093/bioinformatics/btz305

PubMed Abstract|CrossRefフルテキスト|Google Scholar

このような場合、「Circos: an information aesthetic for comparative genomics」(比較ゲノム学のための情報美学)と呼ばれます。ゲノム研究 19, 1639-1645.

PubMed Abstract|CrossRef Full Text|Google Scholar

Lasken, R. S. (2007). Multiple displacement amplificationを用いたシングルセルゲノムシーケンス。Curr. Opin. Microbiol. 10, 510-516. doi: 10.1016/j.mib.2007.08.005

クロスレフフルテキスト|Google Scholar

Letunic, I., and Bork, P. (2021). Interactive tree of life (iTOL) v5: an online tool for phylogenetic tree display and annotation(系統樹の表示とアノテーションのためのオンラインツール). Nucleic Acids Res. 49, W293-W296. doi: 10.1093/nar/gkab301.

PubMed Abstract|CrossRefフルテキスト|Google Scholar

Li, H. (2016). Minimap and miniasm: Noisy long sequencesのための高速マッピングとde novoアセンブリ。バイオインフォマティクス 32, 2103-2110.

PubMed Abstract|CrossRef Full Text|Google Scholar

Li, H. (2018). Minimap2: ヌクレオチド配列のためのペアワイズアライメント。バイオインフォマティクス 34, 3094-3100. doi: 10.1093/bioinformatics/bty191

PubMed Abstract|CrossRef Full Text|Google Scholar

Lindenbaum, P. (2015). JVarkit: バイオインフォマティクスのためのJavaベースのユーティリティ doi: 10.6084/M9.FIGSHARE.1425030

クロスリフフルテキスト|Google Scholar

Marbouty, M., Thierry, A., Millot, G. A., and Koszul, R. (2021). MetaHiCファージ-バクテリア感染ネットワークは、健康なヒトの腸のアクティブな循環ファージを明らかにする.elife 10:e60608.

PubMed Abstract|CrossRef Full Text|Google Scholar

McInnes, L., Healy, J., Saul, N., and Großberger, L. (2018). UMAP: uniform manifold approximation and projection. J. オープンソースソフトウェア. 3:861. doi: 10.21105/joss.00861.

クロスレフフルテキスト|Google Scholar

Moss, E. L., Maghini, D. G., and Bhatt, A. S. (2020).(モス、イー・エル、マギーニ、ディー・ジー、バット、エス・エス)。ナノポアシーケンスを用いたマイクロバイオームからの完全な閉鎖型細菌ゲノムの作製。Nat. Biotechnol. 38, 701-707. doi: 10.1038/s41587-020-0422-6

PubMed Abstract|CrossRef Full Text|Google Scholar

Nayfach, S., Shi, Z. J., Seshadri, R., Pollard, K. S., and Kyrpides, N. C. (2019). グローバルなヒト腸内細菌群の未培養ゲノムからの新たな洞察。ネイチャー 568, 505-510. doi: 10.1038/s41586-019-1058-x

PubMed Abstract|CrossRef Full Text|Google Scholar

西川祐子・細川雅彦・丸山利雄・山岸和彦・森毅・竹山宏 (2015). 単細胞全ゲノム増幅における低バイアス、コンタミネーションフリー反応のための単分散ピコリットルドロップレット. PLoS One 10:e0138733. doi: 10.1371/journal.pone.0138733.

PubMed Abstract|CrossRef Full Text|Google Scholar

西川祐子・粉川雅史・細川真一・我妻亮太・峯田和彦・高橋和也・他 (2022). ゲルビーズを用いたシングルセルゲノムシーケンスプラットフォームの土壌・海水への応用の検証. ISME Commun. 2:92. doi: 10.1038/s43705-022-00179-4

CrossRefフルテキスト|Google Scholar

Page, A. J., Cummins, C. A., Hunt, M., Wong, V. K., Reuter, S., Holden, M. T. G., et al. (2015). Roary: 迅速な大規模原核生物パンゲノム解析. バイオインフォマティクス 31, 3691-3693. doi: 10.1093/bioinformatics/btv421

PubMed Abstract|CrossRef Full Text|Google Scholar

Parks, D. H., Imelfort, M., Skennerton, C. T., Hugenholtz, P., and Tyson, G. W. (2015). CheckM: 分離株、単細胞、メタゲノムから回収した微生物ゲノムの品質を評価する。ゲノム・リサーチ 25, 1043-1055.

PubMed Abstract|CrossRef Full Text|Google Scholar

Pasolli, E., Asnicar, F., Manara, S., Zolfo, M., Karcher, N., Armanini, F., et al.(2019年)。年齢、地理、ライフスタイルにまたがるメタゲノムから15万を超えるゲノムを用いて明らかになった広範な未踏のヒトマイクロバイオームの多様性。セルズ 176, 649-662.e20. doi: 10.1016/j.cell.2019.01.001

PubMed Abstract|CrossRefフルテキスト|Google Scholar

Rinke, C., Lee, J., Nath, N., Goudeau, D., Thompson, B., Poulton, N., et al (2014). FACSベースのシングルセルゲノミクスを用いた未培養の環境微生物からのゲノムの取得。Nat. Protoc. 9, 1038-1048. doi: 10.1038/nprot.2014.067

PubMed Abstract|CrossRefフルテキスト|Google Scholar

Seemann, T. (2014). Prokka: Rapid Prokaryotic Genome annotation. バイオインフォマティクス 30, 2068-2069.

PubMed Abstract|CrossRef Full Text|Google Scholar

Shaffer, M., Borton, M. A., McGivern, B. B., Zayed, A. A., La Rosa, S. L., Solden, L. M., et al.(2020).。DRAM for distilling microbial metabolism to automate the curation of microbiome function(微生物代謝を蒸留し、マイクロバイオーム機能のキュレーションを自動化するDRAM)。Nucleic Acids Res. 48, 8883-8900.doi: 10.1093/nar/gkaa621

PubMed Abstract|CrossRef Full Text|Google Scholar

Shaiber, A., and Eren, A. M. (2019). 複合メタゲノム集合ゲノムは、公開ゲノムリポジトリの質を低下させる。MBio 10, e00725-e00719. doi: 10.1128/mBio.00725-19

クロスレフフルテキスト|Google Scholar

このような場合、「Teeling, H., Waldmann, J., Lombardot, T., Bauer, M., and Glöckner, F. O. (2004).」と呼ぶことにします。TETRA: a web-service and a stand-alone program for the analysis and comparison of tetranucleotide usage patterns in DNA sequences(DNA配列におけるテトラヌクレオチド使用パターンの解析と比較のためのウェブサービスとスタンドアローンプログラム)。このような場合、「BMC Bioinformatics 5:163」を参照してください。

PubMed Abstract|CrossRefフルテキスト|Google Scholar

Van Rossum, T., Ferretti, P., Maistrenko, O. M., and Bork, P. (2020). 種内の多様性:マイクロバイオームにおける菌株の解釈。Nat. Rev. Microbiol. 18, 491-506. doi: 10.1038/s41579-020-0368-1

PubMed Abstract|CrossRef Full Text|Google Scholar

Walker, B. J., Abeel, T., Shea, T., Priest, M., Abouelliel, A., Sakthikumar, S., et al.(2014)。Pilon: an integrated tool for comprehensive microbial variant detection and genome assembly improvement(Pilon:包括的な微生物バリアント検出とゲノムアセンブリ改善のための統合ツール)。PLoS One 9:e112963. doi: 10.1371/journal.pone.0112963.

PubMed Abstract|CrossRef Full Text|Google Scholar

Wang, Y., Wan, X., Wu, X., Zhang, C., Liu, J., and Hou, S. (2021). Eubacterium rectaleは、大腸炎の促進を介して大腸癌の発生に寄与している。Gut Pathog. 13:2. doi: 10.1186/s13099-020-00396-z

PubMed Abstract|CrossRefフルテキスト|Google Scholar

Woyke, T., Doud, D. F. R., and Schulz, F. (2017). 微生物シングルセルシーケンスの軌跡。Nat. Methods 14, 1045-1054. doi: 10.1038/nmeth.4469.

PubMed Abstract|CrossRefフルテキスト|Google Scholar

Zeevi, D., Korem, T., Godneva, A., Bar, N., Kurilshikov, A., Lotan-Pompan, M., et al. (2019). 腸内細菌叢の構造的変動は宿主の健康と関連する。ネイチャー 568, 43-48. doi: 10.1038/s41586-019-1065-y

クロスレフフルテキスト|Google Scholar

キーワード:腸、マイクロバイオーム、シングルセルゲノミクス、ロングリードシーケンス、ゲノム

引用元 小川真由美, 西川陽子, 佐伯俊哉, 依田巽, 有川浩, 武山浩, 細川護 (2023) Single-cell long-read sequencingで未培養ヒト腸内細菌の種内多様性を明らかにする. Front. Microbiol. 14:1133917.論文番号: 10.3389/fmicb.2023.1133917

Received: 2022年12月29日; Accepted: 2023年2月06日。
公開:2023年2月24日

編集者

エリック・ダニエル・ベクラフト(北アラバマ大学、アメリカ合衆国
査読者:Eric Daniel Becraft, University of North Alabama, USA

Yu-Wei Wu, 台北医学大学, 台湾
Wei-Hua Chen, 華中科技大学, 中国
Copyright © 2023 Kogawa, Nishikawa, Saeki, Yoda, Arikawa, Takeyama and Hosokawa. これは、クリエイティブ・コモンズ表示ライセンス(CC BY)の条件の下で配布されるオープンアクセスな記事です。原著者および著作権者のクレジットを表示し、本誌の原著を引用することを条件に、他のフォーラムでの使用、配布、複製を許可する。本規定に従わない使用,配布,複製は認めない.

*連絡先 細川雅仁,✉ masahosokawa@aoni.waseda.jp

免責事項:本論文で述べられているすべての主張は,著者個人のものであり,必ずしも所属機関のもの,あるいは出版社,編集者,査読者のものを代表するものではありません。この記事で評価される可能性のある製品またはその製造元による主張は、出版社によって保証または承認されるものではありません。

こんな人も見ています
シングルセルゲノムシーケンスを用いたヒト皮膚優勢菌種の菌株多様性の探索
井手圭吾、佐伯達也、有川浩二、依田卓也、遠藤樽帆、松橋あゆみ、竹山晴子、細川雅仁

マイクロバイオーム解析による葉巻発酵用Candida属自生スターターの開発
Yun Jia, Yuanfa Liu, Wanrong Hu, Wen Cai, Zhaojun Zheng, Cheng Luo, and Dongliang Li

炎症性腸疾患を併発したイラン人患者におけるClostridioides difficile感染症再発治療のための糞便微生物移植前後での腸内細菌叢変化
Fahimeh Sadat Gholam-Mostafaei, Masoumeh Azimirad, Kaveh Naseri, Ali Nabavi-Rad, Hamid Asadzadeh Aghdaei, Shabnam Shahrokh, Nasser Ebrahimi Daryani, Abbas Yadegar and Mohammad Reza Zali (英語)。

認知機能障害の危険因子としての農薬。認知機能障害の予防・改善のための代替手段としての天然物質への期待
Liankui Wen, Xiwen Miao, Jia Ding, Xuewen Tong, Yuzhu Wu, Yang He, Fei Zheng, Usune Etxeberria, Shahid Ali Rajput および Ufuk Okkay

中国産シーバス(Lateolabrax maculatus)のAeromonas hydrophila感染に対する応答の違いに関するトランスクリプトーム、腸内マイクロバイオームおよび組織形態学的プロファイリング
Chao Pan, Yanran Zhu, Kaixin Cao, Juexian Li, Siyu Wang, Jiahua Zhu, Xiaoman Zeng, Heqian Zhang および Zhiwei Qin

フッター

ガイドライン

探索

アウトリーチ

接続
フォローする
© 2023 Frontiers Media S.A. All rights reserved
個人情報保護方針
|
利用規約

この記事が気に入ったらサポートをしてみませんか?