乳酸菌の生合成を系統的に調べることで、ヒトのマイクロバイオームを形成する可能性のある多様な拮抗性バクテリオシンが明らかになった


オープンアクセス
発行:2023年4月27日
乳酸菌の生合成を系統的に調べることで、ヒトのマイクロバイオームを形成する可能性のある多様な拮抗性バクテリオシンが明らかになった


チャン・デンウェイ(Dengwei Zhang)、
ジャン・チャン(Jian Zhang)、
...
李永信
作家を表示する
マイクロバイオーム11巻、記事番号:91(2023) この記事を引用する
1 Altmetric(アルトメトリック
メトリックス詳細
アブストラクト
背景
乳酸菌(LAB)は様々な生理活性二次代謝産物(SM)を産生し、LABに宿主を保護する役割を持たせている。しかし、LAB由来のSMsの生合成の可能性は、特にヒトのマイクロバイオームにおけるその多様性、存在量、および分布において、依然として不明な点が多い。したがって、LAB由来のSMがマイクロバイオームのホメオスタシスにどの程度関与しているかは、まだ不明である。
研究成果
ここでは、31,977のLABゲノムからLABの生合成能を系統的に調査し、2,849遺伝子クラスター・ファミリー(GCF)の130,051二次代謝物生合成遺伝子クラスター(BGC)を特定しました。これらのGCFのほとんどは、種特異的、あるいは株特異的であり、まだ解明されていない。我々は、748のヒト関連メタゲノムを解析し、ヒトのマイクロバイオームにおいて非常に多様でニッチに特化しているLAB BGCのプロファイルを明らかにした。その結果、ほとんどのLAB BGCは、機械学習モデルによって予測された広範な拮抗作用を持つバクテリオシンをコードしており、ヒトのマイクロバイオームにおいて保護的な役割を果たす可能性があることを発見しました。クラスIIバクテリオシンは、最も豊富で多様なLAB SMsの一つであり、特に膣内細菌叢に濃縮され優勢であることがわかった。我々は、メタゲノム解析とメタトランスクリプトーム解析により、機能的なクラスIIバクテリオシンを発見した。これらの抗菌性バクテリオシンは、膣内の微生物群集を制御し、微生物相の恒常性維持に寄与する可能性があることが示唆された。
結論
本研究では、ヒトマイクロバイオームにおけるLABの生合成の可能性とそのプロファイルを系統的に調査し、オミックス解析によりマイクロバイオームのホメオスタシスに対する拮抗的な貢献と関連付ける。このような多様で一般的な拮抗性SMの発見は、マイクロバイオームと宿主に対するLABの保護的役割のメカニズム研究を刺激し、LABとそのバクテリオシンの治療代替としての可能性を強調することが期待されます。
動画はご覧いただけません。
動画の概要
はじめに
乳酸菌(LAB)はグラム陽性の微好気性細菌で、さまざまな生物学的プロセスにおいて基本的な役割を果たすことから、広く注目されています[1]。LABは、炭水化物代謝中に乳酸を生成する能力で知られており、食品発酵に不可欠であることから、食品産業で広く使用されています[2]。その固有の安全性から、LABは食品添加物、医薬品、治療用分子を生産するために遺伝子操作されてきた[1,2,3,4]。さらに重要なことに、ある種のLAB株は、摂取することで大きな健康効果をもたらすことが明らかになりつつあり、プロバイオティクスとして魅力的な候補となっている[5]。LABは、腸内細菌叢の調節、生物活性代謝物の生産、免疫系の調節など、複数のメカニズムを通じてプロバイオティクス効果を発揮する可能性があり、これらすべてがLABに宿主を守る役割を与えている [6]。微生物叢を制御するプロバイオティクスとしてのLABの特徴に焦点を当てた多くの研究にもかかわらず、LABがマイクロバイオームのホメオスタシスと宿主の生理学にどのように影響するかは、まだ十分に理解されていません。
代謝クロストークは、LABを含む微生物が宿主とどのように相互作用し、マイクロバイオームのホメオスタシスを維持するかにおいて基本的な役割を果たす。これらの相互作用が起こる方法の1つは、抗生物質や色素などの二次代謝産物(SM)を含む、微生物による多数の代謝産物の生産を通じて行われます。相互作用や拮抗作用など、SMを介した相互作用は、マイクロバイオームの恒常性を維持する上で極めて重要です[7, 8]。特に、Lactobacillus、Streptococcus、Lactococcusなどの多くのLABメンバーは、nisinやlactocillinなどのバクテリオシンから四級酸のreutericyclinまで、多様な生理活性SMを産生します[9、10、11]。バクテリオシンはリボソームで合成される抗菌力のあるペプチドで、一般に3つのクラス[クラスI:翻訳後修飾ペプチド(ナイシン、ラクトシリンなど);クラスII:小さな非修飾ペプチド(アミロボリンL、クリスパシンAなど);クラス III:大きな熱可逆ペプチド]に分けて分類されます。[12, 13]. LABが生産する二次代謝産物の中で最も広く研究されているバクテリオシンは、微生物組成を調節し、病原体を抑制することが示されており、微生物叢を形成する潜在的役割を示唆しています[14]。しかし、LAB二次代謝産物に関するこれまでの研究は、主に構造、生合成、作用機序、または感染症を予防する治療的可能性にケースバイケースで焦点を当てたものでした[15]。したがって、LAB SMsのランドスケープ、特にヒトマイクロバイオームにおけるその多様性、普及率、潜在的な役割は依然として不明であり、マイクロバイオームのホメオスタシスへの積極的な関与を明らかにすることは困難である。
バイオインフォマティクス技術の発展により、近年、細菌ゲノムやメタゲノムが急速に解読され、単一種や群集レベルでの大規模な生合成解析の新たな機会がもたらされています。ここでは、生合成とメタゲノム解析の最近の進歩を利用して、LAB SMの未開拓の生合成の可能性を系統的に調査しました。31,977のLABゲノムと748のヒトマイクロバイオームメタゲノムを網羅的に解析した結果、LAB SMsの生合成能力、ヒトマイクロバイオームにおける多様性、存在量、分布についてこれまで知られていなかった知見を得ることができました。その結果、ほとんどの二次代謝産物生合成遺伝子クラスター(BGC)が、まだ解明されていない拮抗性SMをコードしている可能性があることが明らかになった。また、ヒトのマイクロバイオームにおいて保護的な役割を果たす可能性のある新しいクラスIIバクテリオシンを発見し、クリスパシン467と名付けた。これは、ヒトのマイクロバイオームにおけるLABの生合成の可能性とそのプロファイルを、オミックス解析によってマイクロバイオームのホメオスタシスに対する拮抗的な貢献と関連付けながら調査した、最初の大規模なものであると言えます。ヒトマイクロバイオーム、特に膣マイクロバイオームにおける多様で一般的な拮抗性バクテリオシンのオミックス誘導による発見は、マイクロバイオームの恒常性に関連する拮抗的相互作用に関する洞察をもたらし、拮抗性SMを有するLABのプロバイオティクスとしての可能性を強調する。
研究成果
ゲノム解析で明らかになったLABのSM生合成ポテンシャルのランドスケープ
環境または食品が腸内細菌叢のLAB源となる可能性があることから、ヒト微生物叢のLAB SMsをプロファイルするために、まずLAB SMsの生合成の可能性を包括的に調査するために、異なるソースからLABゲノムを収集しました。公開されているLABのシングルアンプリファイドゲノム(SAG)とメタゲノム集合ゲノム(MAG)は、3つのデータベース(RefSeq [16], PATRIC [17], IMG/M [18] )と2つの先行研究 [19, 20] から集め、合計40,879 SAG と 4,575 MAGが得られた(補足表1)。その後、ゲノムの重複排除を行い、GTDB分類法を用いて分類学的な分類を検証し統一した。その結果、LAB SMのグローバルな生合成解析のために、56属6科にまたがる31,977のLABゲノム(27,549 SAGおよび4,428 MAG、補足表2)が保持された(補足図1a)。ルールベースのBGC検出ツールであるantiSMASH 6.0 [21]を用いて、30,718ゲノムから130,051個のBGCを特定した(図1a、補足図1b、補足表3)。このうち1,333個の非リボソームペプチド合成酵素クラスター(NRPS, 1. 0%)、ポリケチド合成酵素クラスター(PKS、19.7%)、リボソームでコードされ翻訳後修飾されたペプチド(RiPPs、76.0%)、テルペン(1.3%)、その他のタイプの代謝物をコードするBGC(2.3%)の計98,810個が含まれていました(補足図2)。ゲノムあたりのBGCは0~14個で、平均は4.07個であった。最も多いRiPPのうち、RiPP-like(以前はantiSMASHでbacteriocinとアノテーションされていた)が72,471個(全BGCの55.7%)でトップであることがわかりました。BiG-SLiCE[22]を用いて72,471個のRiPP-like BGCからバクテリオシン生合成関連ドメインを抽出したところ(補足図3、補足表4)、LAB SMの中で最も多いクラスIIバクテリオシン(BiG-SLiCEで同定したクラスIIバクテリオシン関連ドメインを持つRiPP-like BGC)60,497個(46.5%)と判明(図1A)。
図1
a 31,977のLABゲノムから同定されたBGCの全体像。括弧の外の数字はBGCの数、中の数字は対応する割合とBGCが存在する属の数を表す。中央のドーナツチャートは、BGCの全体的なクラス分布を表示し、対応する色は(b)の第4層と一致しています。一方、右側のドーナツチャートは、RiPP BGCのクラス分布を示し、色は(b)の第5層に対応する。 b レイヤーは以下の通り: 代表的なLAB56ゲノムの120個のマーカー遺伝子を連結して作成した最尤系統樹。本研究のLABはGTDB分類で6科56属に及ぶ。②は本研究に含まれるゲノムの数で、log2変換されている。③はlog2変換したBGC数。④はLAB属の平均BGC量。⑤はLAB属の平均RiPPs量。RiPPsの用語では、他のサブタイプのBGCやハイブリッドBGCは「その他」に分類される。rSAM-Modified RiPPsは、RaS-RiPP、ranthipeptide、sactipeptideからなる。
フルサイズ画像
LAB属におけるBGCの系統分布を知るために、MAGは不完全なため除外し、BGCを含むSAG26,983個を調査した。生合成能力は、科、属、種レベルで大きく異なっていた(図1b、補足図4)。Tetragenococcus属を除くLAB属では、RiPPsとT3PKS BGCが優勢で、テルペンBGCとNRPS BGCはそれらの属に散在していた(図1、補図5、6)。55属のうち、ゲノムあたり中央値で1個以上のRiPPを28属で、1個のT3PKSを33属で見いだしました。ファーミキューテス属ではRiPPの割合が高いことが報告されているが[23]、特定のLAB属で優勢なT3PKSは、基本的な生物学的機能を持つ特殊な代謝物をコードしているのかもしれない。注目すべきは、ゲノムサイズが小さいにもかかわらず、連鎖球菌科は一般的に他の科よりも豊富なBGCを保有し(補足図4a)、中央値はゲノムあたり5個のBGCで、Lactococcus属とStreptococcus属に代表された。対照的に、33属はゲノムあたり中央値1以下のBGCしか保有しておらず、LAB属の大多数の生合成能力が限られていることが示された(図1b)。LAB属53種と非LAB属3,805種(164,417ゲノム、補足表5)を比較すると、LABの生合成能力は比較的限られており、細菌の生合成能力とそのゲノムサイズの間には有意に強い相関(スピアマンRho = 0.712, P < 0.001 )が見られた(補足図7)。LABの小さなゲノムと生合成能力の低下は、栄養豊富なニッチへの適応と相関しているのかもしれない。
LABのBGCの多くは、種特異的であり、まだ解明されていない
BGCは遺伝子含有量が大きく異なるが、生合成要素のアーキテクチャ関係に基づいてファミリー(GCF)またはクラン(GCC)にグループ化することは、化学的特徴や生物学的機能の観点から、それらのコード生成物の類似性を明らかにする有効な方法である [24]. 130,051個のLAB BGCの新規性と多様性を知るために、BiG-SLiCE [22] を用いてBGC特徴(生合成ドメイン)を抽出し、BGC間の全対全コサイン距離 [25] に基づいてグループ化しました。特徴を持つ129,878個のBGCは、距離の閾値をそれぞれ0.2および0.8として、2,849個のGCFと112個のGCCに分類された(図2、補足図8)。さらに、112個のGCCを「生合成遺伝子に関する最小限の情報」(MIBiG)リポジトリ[26]に記載されている参照既知のBGCと比較しました。その結果、LAP(linear azol(in)e-containing peptides, GCC_29)、RiPP-like(GCC_84)、クラスII lanthipeptides(GCC_110)の3つのクランだけが、平均余弦距離が0.2未満で、既知のBGCと酷似することが判明しました。この結果は、LABの二次代謝産物に関する知識のギャップを明確にし、これらの細菌から新規化学物質を発見する大きな可能性を示している。特に、NRPS(73.2%)、テルペン(99.3%)、T3PKS(99.3%)の大部分は、それぞれ1つのクランに分類された。一方、RiPP BGCは、83のGCCに1,818のGCF(GCCまたはGCFにRiPP比率80%以上)が寄与し、翻訳後修飾(PTM)酵素遺伝子や隣接遺伝子の多様性から、非常に多様である(図2a)。中でも、RiPP様GCC23種のGCF621個はクラスIIバクテリオシンをコードしており、最も多様なLAB SMの1つを表していた。他の60個のRiPP GCCは、主にクラスIバクテリオシンをコードしており、ランティペプチド、LAP、ラソペプチド、rSAM修飾RiPPが含まれていた。
図2
図2は、129,878個の生合成遺伝子クラスター(BGC)を、2,849個の遺伝子クラスター・ファミリー(GCF)と112個の遺伝子クラスター・クラン(GCC)に分類したものである(a)。最も内側のデンドログラムは、MIBiG BGC との平均コサイン距離に基づく 112 の GCC の階層的なクラスタリングを表示します。次の外側の層は、異なる属の割合を示しており、ゲノム数が200未満の属は「その他」に分類されています。続く層は、BGCクラスの割合を表しており、点の大きさはその表現に比例している。外側の2つの層は、対数変換したBGC数とMiBiG BGCへの平均距離を表している。三角形は、特定のクラスIIバクテリオシン関連ドメインが支配的なクランを示す(1つのクランにおける割合>80%)。bは、異なる属(左)、種(中央)、ゲノム(右)に存在するGCFの数を示す棒グラフである。
フルサイズ画像
原核生物のゲノム進化において、属を越えて保存されている遺伝子は、生態系に不可欠なプロセスに貢献する可能性が高い。一方、種特異的、あるいは株特異的な遺伝子は、しばしば自然選択によって生じ、ニッチ適応や宿主の適性を高める[27]。このような背景から、次に属や種に特異的なBGCの分布と多様性を調べた。GCCクラスタリングはLAB SMの分布と新規性を示すが、GCFクラスタリングの微細な解像度は、類似の天然物をコードすると予測されるBGCの多様性についての洞察を提供することができる[28]。我々は、GCFの大半が属特異的(92.6%、2,637/2,849)および種特異的(75.8%、2,159/2,849)であることを発見した。驚くべきことに、1,165個のGCF(40.9%)には、特定の菌株が保有するBGCが1つだけ含まれていた(図2b)。一方、7%(212個)だけが属を超えたGCFであり、その内訳はRiPP142個(2-20属に存在)、NRPS17個(2-3属に存在)、T3PKS21個(2-9属に存在)、テルペン9個(2-7属に存在)でした(補足図9、10)。これらの142の属を超えたRiPP GCFのうち、62がクラスIIバクテリオシンであった。このように属間でGCFの多様性が高いため、GCFの有無に系統的な関係は見られなかった(補足図8)。これらの分類群特異的BGCは、通常、特殊なSMをコードし、ニッチ適応のために生産者に競争力を提供する。LABが異なるニッチに広く存在することを考慮すると[29]、種および株特異的なBGCの高い割合は、ニッチ選択から生じるかもしれない。
ヒトマイクロバイオームにおけるLABのBGCは多様であり、ニッチに特異的である。
多くの研究により、ヒトのマイクロバイオームにおけるLAB種の有病率は様々であることが明らかにされており[20]、ニッチ適応のために、そのSMが身体部位によってどの程度異なるのかという疑問が提起されている。そこで我々は、Human Microbiome Project(HMP)[30]の6つの身体部位の748個のメタゲノムを再調査し、健康なヒトのマイクロバイオームにおけるLAB BGCのプロファイルを探った。これらの部位には、好気性(前鼻、皮膚マイクロバイオーム)、微好気性(歯肉上歯垢、頬粘膜、舌背、後鼻、口腔および膣マイクロバイオーム)、嫌気性(便、腸マイクロバイオーム)の環境が含まれていました(補足表6)。以前の大規模な研究[20]と同様に、LABは体の部位によって存在量と有病率が異なることがわかりました(図3a)。特に、膣ではLactobacillus属が優勢で、存在率の中央値は99.0%[四分位範囲(IQR)、91.0%-99.8%]であったが、Streptococcusは中程度であったが6体の部位で非常に優勢であった。
図3
ヒトマイクロバイオームにおけるLAB BGCは可変的でニッチに特異的である。 a 6つの身体部位の微生物群集におけるLAB属の有病率と存在感。点の大きさと色は、それぞれ属の有病率と存在量の中央値に比例している。 b GCF蓄積曲線は、より多くのサンプルを含めると、検出されるGCFの数が増加することを示す。6つの身体部位のメタゲノム数は以下の通り:前鼻孔66、便100、後鼻孔169、歯肉上歯垢281、頬粘膜66、舌背66。 c 6つの身体部位で検出されたGCFの数です。データは平均値±標準偏差で、上段のエラーバーのみ表示。d ボックスプロットは、6つの身体部位で検出された異なるBGCの存在量を示す。 e 円グラフは、610個のGCFが何部位で検出されたかの割合を示し、異なる色を使って区別する。括弧内には対応するパーセンテージが示されている。左の棒グラフは、各部位におけるGCFの数を示しています。上部の棒グラフは、各交差点の GCF の数を示しています。f 属・種・ゲノム特異的 GCF と属・種・ゲノム横断的 GCF のうち、1 つのサイト(ニッチ特異的)または複数のサイト(クロスニッチ)で検出されたものの数.カイ二乗検定でP値を求めた。*, 0.01 < p < 0.05; , p < 0.001
フルサイズ画像
ヒトマイクロバイオームにおけるLAB BGCの多様性、存在量、分布をプロファイルするために、130,051個のBGCを24,222個の代表BGCに重複排除し、メタゲノムリードを24,222個の非冗長BGCにマッピングしました。6つの身体部位で検出されたLAB BGCの数は、LABの存在量が変化するためか、口腔で最も多く、皮膚で最も少なく、かなり差がありました(補足図11a)。748個のメタゲノムから、71個のT3PKSと312個のRiPPを含む610個のGCFの5,687個のBGCを検出し、クラスIIバクテリオシンを92個検出した(補足図11b)。GCF蓄積曲線は、より多くのサンプルを含めると、それらの身体部位でより多くのGCFが検出されることを示し、ヒトマイクロバイオームにおけるLAB SMの巨大な多様性を明らかにした(図3b)。口腔の3部位はGCFが最も豊富であった(平均29、38、54)。口腔と比較して、膣はGCFの多様性は低い(平均12)が、LAB BGCの存在量は有意に高い(図3c、d)。特に、膣マイクロバイオームでは、クラスIIバクテリオシン、ラソペプチド、ランティペプチド、LAPが高濃度で検出された。なお、シーケンスの深さに影響され、ヒトのマイクロバイオームにおけるLAB BGCの多様性と存在量は過小評価されている可能性がある。検出された610個のGCFのうち、約52%は6つの部位のいずれかにニッチに特化しており、特定の部位のGCFの18%~38%を占めていました(図3e)。また、これらのニッチ特異的なGCFは、一般に種特異的(カイ二乗検定、P < 0.001)であり、属特異的(P = 0.026)や株特異的(P = 0.013)ではないことが確認された(図3f)。この結果は、ニッチ特異的なGCFは、異なるニッチに存在する異なる種に由来し、宿主のニッチ適応に競争優位性を与える可能性を示している。ゲノムおよびメタゲノム解析による生合成能の解析から、LAB SMはヒトのマイクロバイオームにおいて多様かつ多様に存在することが明らかになりました。
機械学習モデルにより、ほとんどのBGCが拮抗するSMをコードしている可能性があることが明らかになった
ヒトのマイクロバイオームにおけるLAB BGCの豊富さと有病率を考慮すると、次に、BGCがコードするSMの潜在的な生物活性を研究したいと思います。BGCがコードするSMの生物活性は、最近、予測される化合物構造の化学的指紋、タンパク質ファミリー(PFAM)ドメイン、およびその他の遺伝的特徴に基づく機械学習戦略を使って予測された[31,32,33]。ここでは、4つの一般的な機械学習分類法(ロジスティック回帰、弾性ネット回帰、ランダムフォレスト、サポートベクターマシン)を適応して、LAB由来のSMの生物活性を予測した。学習データ(950種類の既知のBGC、補足表7、補足図12)に対して、10重クロスバリデーションを行った結果、ランダムフォレスト分類器は、抗菌、抗真菌、抗腫瘍・細胞毒性のそれぞれについて、平均受信者動作特性曲線下面積(AUROC)が0.76、0.80、0.82と、他の分類器を上回った(図4a、補足図13)。ランダムフォレスト分類器の性能は、これまでに報告されている手法[31, 32]と同等であった。
図4
a 10重クロスバリデーションを用いた4つの機械学習分類法(ロジスティック回帰、弾性ネット回帰、サポートベクターマシン(SVM)、ランダムフォレスト)の化合物活性の決定における性能。受信者動作特性(ROC)曲線は、10重クロスバリデーションの性能を集約したものである。b 129,878個のBGCの予測活性を示すコードダイアグラム。スケールは、各BGCクラスまたは予測された活性の割合である。括弧内に示した数字は、BGC数およびBGC全体に対する割合を意味する。Antibacterial-antifungal および antibacterial-cytotoxic は、二重機能 SM をコードする BGC を表す。BGCとその予測される活性との関連は、活性タイプに応じて異なる色でハイライトされている。 c LAB種と非LAB種のBGCがコードする抗菌性SMの割合(Proportion of antibacterial SMs encoded by BGC from LAB and non-LAB species. 抗菌活性の割合は、LABまたは非LABの10,000個のBGCをランダムに選択し、1,000回再サンプリングして算出した。データは平均値±標準偏差である。P値はWilcoxon rank-sum検定(両側)により与えられ、"
"はP < 0.001を表す。 d 6つの身体部位で検出されたBGCの推定活性の割合。ANは前鼻腔、Stは便、PFは後鼻腔、SPは歯肉上歯垢、BMは頬粘膜、TDは舌背部
フルサイズ画像
ランダムフォレスト分類器を用いると、129,878個のLAB BGCが異なる生理活性SMをコードしていると予測され、抗菌性(n = 123,587, 95.2%), 細胞毒性(n = 2,268, 1.8%), 抗菌-抗真菌(n = 79, 0.1%), 抗菌-細胞毒性(n = 2,548, 2.0%), 不明(n = 1,395, 1.1%) からなっています。BGCクラスに関係なく、ほとんどのBGCが抗菌性を有すると予測された(図4b)。特に、RiPPの97.8%(96,466/98,637)が抗菌活性を示すと予測され、バクテリオシンはLABに豊富に存在することが示唆された。抗菌活性が予測されたRiPPのうち、ポストモディフィケーションが知られているものはクラスIバクテリオシンに分類され、RiPPに似たもの(83.4%)はクラスIIバクテリオシンに分類されました。クラスIIバクテリオシンのほぼ100%(60,494/60,497)が抗菌性SMとして捕捉され、LAB由来の抗菌薬の48.1%に貢献した。これらの抗菌性BGCは、ほぼすべてのLAB属を支配しており(補足図14)、おそらく微生物群集における競争力を付与しているものと考えられる。LAB以外のゲノムから同定されたBGC(n = 1,121,156)と比較すると、LAB由来のBGCは、抗菌性SMをコードする割合が著しく高く、LAB SMの拮抗力が高いことを示していた(ウィルコクソン順位和検定、P < 0.001 )(図4c、補足図15a、b)。細胞毒性または抗真菌性の推定SMをコードするLAB由来のBGCは、特定の種で低い割合で見つかった(補足図15c、d)。例えば、細胞毒性活性を持つ可能性のあるLAPファミリー(GCF_199)は、10種のStreptococcus属に分布し、特に、保存されたLAPが持つ共通の病原性機能が報告されているStreptococcus pyogenesには、その傾向が見られた[34]。6つの身体部位において、検出されたBGCのほとんどが抗菌薬をコードしていると予測され(図4d)、マイクロバイオームの恒常性を維持するための細菌拮抗作用に関与している可能性が示唆された。このような抗菌性SM、特にクラスIIバクテリオシンを含むLABは、病原体の侵入から宿主を守り、拮抗的な相互作用を通じてマイクロバイオームの恒常性に貢献する可能性がある[7]と考えるのはもっともである。
未解明のクラスIIバクテリオシンは、ヒトのマイクロバイオームにおいて広く分布している
クラスIIバクテリオシンの拮抗作用と、ヒトマイクロバイオームにおけるその有病率や優位性が異なるという知見は、クラスIIバクテリオシンがマイクロバイオームの恒常性にどの程度関係しているのかという疑問を提起する。そこで我々は、クラスIIバクテリオシンを、前駆体の配列空間に基づいて、同様の生物学的機能を持つサブファミリーに分類し、ヒト微生物叢におけるそれらのプロファイリングを詳細に調査することを試みた。クラスIIバクテリオシンの化学的多様性を十分に明らかにするために、まず、クラスIIバクテリオシンの前駆体のPfamドメインを検索するhmmsearch [35]とバクテリオシンのマイニングに特化したツールであるBAGEL4 [36] を用いて、前駆体ペプチドの同定に二つのアプローチを採用した(補足表4)。2つのアプローチを組み合わせて、クラスIIバクテリオシンBGCから187,649個の前駆体を同定した(図5a、補足表8)。次に、187,649個の前駆体を、50%の配列同一性を閾値として2,005個のクラスターにグループ化した(補足図16)。それらの代表的な前駆体の配列長は、〜55アミノ酸を中心としたほぼ正規分布をしていた(図5b)。また、蓄積曲線から、含まれるゲノム数に応じて前駆体の多様性が増加することが示され、ゲノム配列の決定数が増えれば、より多くのクラスIIバクテリオシンが開示されることが示唆された(図5c)。さらに、既知のクラスIIバクテリオシン333種類と類似しているクラスターは188種類のみであり(同一性>90%、カバー率>95%)、大部分(1,817/2,005)は未解明であることがわかった(Supplementary Table 9)。なお、ルールベース法であるhmmsearchとBAGEL4は、高い確率で正答を導くことができるが、同時にバクテリオシンの実際の生合成の可能性を過小評価していると思われる。
図5
クラスIIバクテリオシンは、ヒトのマイクロバイオームにおいて構造的に多様であり、様々な形で普及している。 a hmmsearchとBAGEL4によって検出されたクラスIIバクテリオシンの推定前駆体の数。それぞれ128,369個、90,026個の前駆体を同定し、30,746個の共通配列を持つ。 b cd-hit指定した2,005個の代表前駆体の長さの分布。 c クラスIIバクテリオシン前駆体のクラスター(青線)の希薄化曲線(Rarefaction)。赤の破線は、188クラスターに属する1,775配列が既知のクラスIIバクテリオシンと非常に類似していることを示す(同一性>90%、カバー率>95%)、d 異なる属(左)、種(中央)、ゲノム(右)におけるクラスター数。 e, t-SNEプロットは異なる身体部位におけるクラスIIバクテリオシンの異なるプロファイルを明らかにしている。f 6つの身体部位で検出された644のプリカーサークラスターの有病率と平均存在量。各ドットは1つの前駆体クラスターを表す。個体における存在量は補足図17に示す。赤い数字は、対数変換した平均存在量>-5の前駆体クラスター数(赤い破線で示す)と、各身体部位で検出された前駆体クラスター数である
フルサイズ画像
GCFの分類群特異性と同様に、クラスIIバクテリオシン前駆体ファミリーの多くは属特異的(n = 1,862、92.9%)および種特異的(n = 1,327、66.2%)であり、33.7%のファミリーは株特異的(n = 675)さえあった(図5d)。次に、ヒトのマイクロバイオームにおけるそのプロファイルを調べた。6つの身体部位で検出された644のクラスターのうち、約31.8%のクラスターが6つの部位のいずれかにニッチに特異的であった(補足図17a)。さらに、t-SNEプロットで明らかになったように、異なる身体部位におけるクラスIIバクテリオシンのプロファイルは異なっており、ヒト微生物叢におけるクラスIIバクテリオシンのニッチ特異性がさらに支持された(図5e)。膣と皮膚におけるクラスIIバクテリオシンのプロファイルは大きな個人差を示したが、他の身体部位におけるクラスIIバクテリオシンは比較的保存されており、共にクラスター化されていた。さらに、これらのクラスIIバクテリオシンは皮膚と腸に散在していたが、いくつかのクラスIIバクテリオシンは口腔と膣に特に濃縮され、高い有病率と存在度を示した(図5f、補足図17b)。膣では個人差があるためか、クラスIIバクテリオシンのサブファミリーのメンバーのうち、口腔よりも膣の方が相対的に少ない有病率を示しているものがあった。ヒトマイクロバイオームにおけるGCFsプロファイル(図3d)と前駆体プロファイル(図5e、f)の両方から、クラスIIバクテリオシンが膣マイクロバイオームで特に濃縮されていることが示唆されました。膣は、他の部位よりもアルファ多様性が低いシンプルなコミュニティであることを考慮すると[37]、これらの濃縮され優勢なクラスIIバクテリオシンは、膣の微生物コミュニティの制御に重要な役割を果たすのではないかと推論されました。
マルチオミクス解析により、膣内微生物群のホメオスタシスに寄与する可能性のあるクラスIIバクテリオシンが明らかになった。
膣内細菌叢の恒常性に関与すると考えられるクラスIIバクテリオシンを調べるため、まずメタゲノムレベルでクラスIIバクテリオシンと細菌種の間の関連ネットワークを構築しました。その結果、23の前駆体クラスターが様々な細菌種と負の相関を示し、膣内細菌叢を制御する上で拮抗する可能性を示した(図6a)。特に、21個のクラスターは、異常な膣内微生物叢の発生をより助長するLactobacillus inersと負の相関があり、細菌性膣炎治療の新たな治療ターゲットとなりうることがわかりました。さらに、23クラスター中21クラスターがシャノン指数と逆相関していることも判明した(Spearman rho < -0.4, adjusted P < 0.05)(図6b)。これらの検出されたクラスIIバクテリオシンを持つマイクロバイオームでは、細菌の多様性が低いことから、マイクロバイオームの形成に関わる制御的な役割が示唆された。これらの拮抗性バクテリオシンが生物学的に機能するかどうかを確認するために、次に180のメタトランスクリプトームデータセット(補足表6)における発現プロファイルを調べたところ、そのほとんどが健康な人の膣マイクロバイオームで活発に転写されていることがわかった(図6c)。21クラスターのうち3つは既知のクラスIIバクテリオシンとグループ化しており、Lactobacillus amylovorus DCE 471 [38] 由来のAmylovorin L (cluster_342 and cluster_346, a two-component class IIb bacteriocin) と Lactobacillus gasseri SBT2055 [39] 由来のgassericin T (cluster_94) などが挙げられる。オミックスベースの関連解析により、保護的な役割を持つ既知のクラスIIバクテリオシンが見つかったことで、マイクロバイオームにおける制御性バクテリオシンの発見における我々のアプローチの有効性がさらに検証されました。クラスIIバクテリオシンの他の18クラスターもまた、膣マイクロバイオームにおいて広く存在し、活発に転写されているが、まだ未解明であった。
図6
拮抗性のクラスIIバクテリオシンは、膣マイクロバイオームにおいて制御的役割を果たす可能性がある。 a クラスIIバクテリオシンの前駆体クラスターと膣マイクロバイオームの細菌種との間の相関ネットワーク。23のクラスターは、コミュニティ内の細菌種と負の相関があり、ネットワークに示されたスペアマンのrho < -0.3および調整P < 0.05を有する。ノード内の数字は、前駆体クラスター番号を示す。Av, Atopobium vaginae; Dm, Dialister micraerophilus; Lc, Lactobacillus crispatus; Li, Lactobacillus iners; Lp, Lactobacillus paragasseri; Vb, Veillonellaceae bacterium DNF00626 b 前駆体クラスタとα多様性(Shannon index)とのスピアマン相関。破線は相関係数のカットオフ値<-0.4、調整P<0.05を示す。膣メタゲノムで検出された240個の前駆体クラスターを指し、そのうち21個は膣マイクロバイオームのα多様性と有意に関連していた。 c 膣メタゲノム(MG、n = 169)およびメタトランスクリプトーム(MT、n = 180)における既知のクラスIIバクテリオシンに対するグローバル配列同一性(上)、配列長(中)、21クラスターの存在度および有病率(下)。点の大きさと色は、それぞれMGとMTのデータセットにおけるクラスターの有病率と平均存在量に比例している。 d bgc120802の遺伝子構成とcluster_467とcluster_468の前駆体配列。e 化学合成されたバクテリオシンの最小発育阻止濃度(MIC)。NA: not available, 200μg/mLで阻害効果が検出されなかった。グラム(-)菌、グラム陰性菌;グラム(+)菌、グラム陽性菌
フルサイズ画像
次に、これらの未知なるバクテリオシンの拮抗力を実験的に検証することを試みた。原理を証明するために、化学合成が可能な、存在量が多く、ペプチド長が短い2つの前駆体クラスター(cluster_467とcluster_468)を選択しました。これら2つの前駆体は、L. crispatusの16のゲノムから同定されたBGC(例えば、bgc120802)上に位置していた(補足図18)。bgc120802は、2成分レギュレーターシステム(ヒスチジンキナーゼとレスポンスレギュレーター)、ABCトランスポーター、免疫タンパク質を含む特定のクラスIIバクテリオシン関連遺伝子を保有している。16個のBGCから得られた前駆体配列は同一であり、正規のダブルグリシンリーダーを備えていた(図6d、補足図18)。そこで、コアペプチド(補足図19)、すなわちクリスパシン467(27アミノ酸)およびクリスパシン468(30アミノ酸)をそれぞれ合成し、細菌および真菌に対する拮抗活性を検証した。抗菌性試験の結果,クリスパシン467は3種のグラム陽性菌(すなわち,Bacillus timonensis,Brevibacterium senegalense,L. delbrueckii subsp. bulgaricus)に対して抗菌性を示し,最小阻害濃度はそれぞれ3.125μg/mL, 6.25, 12.5 μg/mLとなりました。しかし、crispacin 468の阻害効果は認められず、それらの相乗効果も認められなかった(Fig. 6e)。crispacin 468は、試験菌株以外の他種に対しても抗菌活性を示す可能性がある。以上のことから、バクテリオシン生産者は、多様な拮抗性バクテリオシンで膣内細菌叢を武装し、病原体の侵入を防ぎ、微生物叢を安定させる可能性があると考えられる。LABがどのようにSMを利用してマイクロバイオームコミュニティを形成しているかはまだ十分に解明されていませんが、LABから新しいバクテリオシンをオミックスガイドで発見したことは、マイクロバイオーム異常症に対する新しい抗菌治療薬を発見するための別の方法を提供すると考えられます。
考察
ヒトのマイクロバイオームにおけるLABの健康促進効果はますます認識されつつあるが、他の微生物との相互作用やマイクロバイオームのホメオスタシスへの影響についてはまだ十分に理解されていない。これまでの限られたデータセットによるLABの生合成解析では、特定の代謝物に焦点を当て、宿主に対する保護的な役割を提唱しています[40, 41]。しかし、LAB SMのランドスケープ、特にヒトのマイクロバイオームにおけるそのプロファイルと潜在的な役割については、依然として不明な点が多い。本研究では、LAB BGCの包括的なオミック解析を実施し、LAB BGCの多様性と分布に関する理解を大幅に深めました。その結果、31,977のLABゲノムから2,849のGCFの129,878のBGCを発見し、そのほとんどが種特異的で、多様な未特性のSMをコードしていることがわかりました。さらに、ヒトマイクロバイオームにおけるLABのBGCプロファイルを明らかにするために、6つの身体部位のヒトメタゲノムを調査し、多様なLAB SMがヒトマイクロバイオームにおいて多様に普及していることを明らかにしました。特に、クラスIIバクテリオシンのBGCは、膣内細菌叢で特に濃縮され、優勢であった。ヒト微生物叢におけるGCFのニッチ特異性と、その種特異性、あるいは菌株特異性から、LAB SMsは生産宿主のニッチ適応に競争優位性を与える可能性が示唆された。
本研究では、ヒトマイクロバイオーム中のBGCをプロファイルするために、建築的な関係に基づいてBGCをファミリーやクランにグループ化する確立された方法を採用し、天然物発見のための新規BGCを優先することを可能にした [24, 42]. 有益ではあるが、GCFのグループ分けは、antiSMASH [21]の不完全なBGC境界予測によって影響を受ける。ほとんどのLAB SMは、機械学習モデルを用いて抗菌性があると予測され、ヒトマイクロバイオームにおける制御的役割と宿主に対する保護的役割の可能性を示しています。しかし、学習データが限られているため、機械学習モデルは限られた生物活性(抗菌、抗真菌、抗腫瘍)しか予測できず、LAB SMの他の生物学的可能性を過小評価しています。このような証拠は、他の生物学的機能の可能性を排除するものではないが、我々は、拮抗性LAB SMs、特にバクテリオシンは、その生産者に競争力を与え、マイクロバイオームコミュニティを制御する可能性があると信じている。
メタゲノム解析とメタトランスクリプトミクス解析により、膣内細菌叢で活発に発現し、個々の細菌種と負の相関を示す21種類のクラスIIバクテリオシンが明らかになった。膣内細菌叢のα多様性と負の相関を示すことから、これらのバクテリオシンは恒常性維持に重要な役割を果たすことが想定される。我々は、L. crispatusが生産する新規クラスIIバクテリオシン、すなわち、グラム陽性菌に対して強力な抗菌活性を示すcrispacin 467を同定しました。これまでの解析で、L. crispatusのバクテリオシン生合成遺伝子と抗菌活性が明らかにされているが [43, 44]、その拮抗性バクテリオシンについては、crispacin A [45] を除いてほとんど知られていない。さらに、マイクロバイオームの形成におけるバクテリオシンの潜在的な役割については、まだほとんど解明されていない。ヒトのマイクロバイオームには、Lactobacillusやその他のLABに膨大な数のクラスIIバクテリオシンが存在し、新しい抗菌薬を発見するための大きな可能性を秘めています。21種類のバクテリオシンの前駆体は膣内マイクロバイオームに広く存在し、転写されていたが、それらが膣内のその場で生産されているかどうかは、メタボロミクスによってまだ検討する必要がある。さらに、LABがどのようにSMを採用してマイクロバイオームコミュニティを形成しているのかについては、in vivoマウスモデルやin vitroの多菌モデルを用いてさらに検討する必要があります。しかしながら、本研究で得られた知見は、LABがバクテリオシンを利用して細菌間の相互作用を制御し、微生物群集の構成を維持し、微生物群の恒常性を促進する上で重要な役割を果たすことを示唆しています。乳酸菌の健康上の利点は、乳酸のpH低下効果だけに起因するものではないことに留意することが重要である。膣の酸性化は、病原性微生物や非乳酸菌微生物(Gardnerella、Prevotella、Mobiluncusなど)の増殖を抑制する一方で、バクテリオシンや過酸化水素(H2O2)の生成など、他の要因も膣の健康促進に寄与する[46、47]。L. crispatusが産生するバクテリオシンは、低pHとH2O2産生とともに、膣内の微生物群集を微調整し、健康な膣の生態系を促進したと考えるのが妥当であろう[47]。
LAB、特にLactobacillus属は、適切に投与された場合に宿主に健康上の利益をもたらす既存のプロバイオティクスを支配している[48]。プロバイオティクスの有益な効果は、多様なメカニズムに起因しており、そのうちの1つがバクテリオシンの生成です。プロバイオティクスが有益な効果をもたらすには、生産者のコロニー形成を助け、宿主を保護する役割を果たす拮抗性のバクテリオシンが重要である。今回の発見は、ヒトのマイクロバイオーム、特に膣内に広く存在するLABのバクテリオシンの理解を深めるものであった。健康な人に存在するこれらのLABとそのバクテリオシンは、マイクロバイオームベースの治療薬の有望な優先課題である[49]。例えば、膣内細菌叢を調節する可能性があることから、ラクトバチルス属を含むプロバイオティクスは、細菌性膣炎の治療に応用されています[47]。さらに、多様な拮抗作用を持つバクテリオシンを利用して、治療効果を持つ有益なLABプロバイオティクスを遺伝子工学的に構築し、病原体の侵入を直接または間接的に(微生物学的および/または免疫学的な調節を介して)防ぐことができる[50]。生合成能力および生態学的役割の継続的な研究は、LABおよびその拮抗性SMの臨床応用を促進するのに役立つと考えられる。
以上のことから、本研究は、LABのSMの生合成能に関するグローバルな知見を提供するとともに、微生物群の恒常性を制御する可能性のある拮抗的SMをオミックスガイドによって発見するための出発点となる。クラスIIバクテリオシンは、膣内細菌叢で優勢であるが、その細菌多様性とは負の相関があり、微生物群集で拮抗的な役割を果たすことが実験的に検証されている。我々の知る限り、本研究は、健康なヒトのマイクロバイオームにおけるLAB SMの生合成の可能性とそのプロファイルを体系的に明らかにした最初のものである。しかし、ここで紹介した分析は、網羅的とは言えません。SMの生物活性を予測するために採用した機械学習戦略は、LAB SMとその生合成および生物活性に関する知識の蓄積によって、より洗練されたものになると思われる。さらに、LABがどのようにSMを利用してヒトニッチにおけるマイクロバイオームコミュニティを形成しているのかについては、まだ研究が必要である。しかしながら、LABの生合成の可能性を系統的に調査したことは、ヒトのマイクロバイオームから治療効果のあるSMをオミックスガイドによって発見するための良い出発点となります。LABのSMsのプロファイルとヒトマイクロバイオームにおける潜在的な制御役についての理解を深めることに加え、拮抗性バクテリオシンの発見は、LABの様々なプロバイオティクス応用に関する将来の研究へのエキサイティングな機会を開くものである。
研究方法
データ取得
初期に定義されたように、乳酸菌は、Lactobacillus、Lactococcus、Leuconostoc、Pediococcus、Streptococcus、Aerococcus、Alloiococcus、Carnobacterium、Dolosigranulum、Enterococcus、Oenococcus、Tetragenococcus、VagococcusおよびWeissellaからなる14属を含む[51]。特に、Lactobacillus属は最近再分類され[52]、Lactobacillus, Paralactobacillus, Amylolactobacillus, Acetilactobacillus, Agrilactobacillus, Apilactobacillus, Bombilactobacillus, Companilactobacillus, Dellaglioa, Fructilactobacillusからなる25属にまで広がっている、 フルフリラクトバチルス、ホルザップフェリア、ラクタセイバシルス、ラクチプランティバシルス、ラピディラクトバチルス、ラチラクトバチルス、レビラクトバチルス、 リギラクトバチルス、リモシラクトバチルス、リコリラクトバチルス、ロイゴラクトバチルス、パウシラクトバチルス、シュライファイラクトバチルス、セキュンディラクトバチルス。これらの38属のゲノムを分類学的にフィルタリングし、NCBI参照配列(RefSeq)データベース [16] (2021年8月現在、SAGのみ含む)、PATRICデータベース(SAG含む) [17] 、IMG/Mデータベース(SAGとMAG含む) [18] から取得した。これらに加え、ヒト腸内細菌叢(SAGとMAGを含む)[19]と食品由来LAB(MAGを含む)[20]に焦点を当てた2つの先行研究からのゲノムも含まれました。参照ゲノムの冗長性を避けるため、RefSeqのゲノムはMash v2.3[53]を用いて自身と他のソースからのゲノムを比較しました。Mashの距離が0であるゲノムを同一とみなした。コンティグ数が最小のものだけが残された。誤分類の可能性があるため、GTDB-Tk v1.7.0 [54]をさらに用いて、GTDB-Tk reference data version r202 [55]に対して分類学的注釈の確認と統一を行った。NCBI分類法とGTDB分類法の間には若干の違いがある[56]。GTDB分類法では、5つの属が細分化されている: GTDB分類法では、Carnobacterium、Enterococcus、Lactococcus、Vagococcus、Weissellaの5つの属が細分化されている。最終的に、6科(Lactobacillaceae、Aerococcaceae、Streptococcaceae、Vagococcaceae、Enterococcaceae、Carnobacteriaceae)に属する合計56属が、本研究でLABのメンバーと見なされた。
生合成遺伝子クラスター解析
各ゲノムの生合成遺伝子クラスターは、antiSMASH 6.0 [21]を用い、デフォルトのパラメータでアノテーションを行った。合計で31,977のLABゲノムと164,417の非LABゲノム(RefSeqとGTDBリポジトリバージョンr202の交差点)[56]がBGCアノテーションに含まれました。その結果、30,718個のLABゲノムから130,051個のBGCが、155,540個のnon-LABゲノムから1,122,204個のBGCが検出されました。1,259のLABゲノムと8,877の非LABゲノムでは、BGCのアノテーションはありませんでした。
BGCのファミリーおよびクランへのクラスタリング
BiG-SLiCE[22]は、大規模なBGCをクラスタリングするツールで、2つのBGC特徴(biosynthetic-Pfamとsub-Pfamドメイン)を持っています。これらのBGCの特徴は、異なるBGCクラスを区別するのに十分である。以前の研究[25]で述べたように、MIBiG 2.0リポジトリからLAB BGCと1910の実験的に検証されたBGCのすべての特徴をBiG-SLiCE v1.1.0 で抽出し、その後PythonスイートSciPy version 1.6.2 [57] でBGC間の全対全コサイン距離を計算するのに用いた。このコサイン距離は、次に、Python 3.8 と Scikit-learn version 0.24.2 [58]を用いて、BGCをファミリー(GCF、距離<0.2)とクラン(GCC、距離<0.8)にグループ分けし、平均連鎖による階層的クラスタリングにかけた。
メタゲノミクスおよびメタトランスクリプトミクス解析
748のHMPサンプル[30]のメタゲノム生シークエンスリードと180の膣サンプル[59]のメタトランスクリプト生データは、それぞれプロジェクトアクセッション番号PRJNA48479とPRJNA797778でNCBI SRA (Sequence Read Archive) [60] から入手しました。低品質なシーケンシングリードの検出と除去には、デフォルトパラメーターのFastp 0.21.1 [61]が採用された。高品質なメタゲノム解析リードは、GENCODE [62]のヒト参照ゲノム(GRCh38.p13)に対する検索により、ヒト宿主に属するリードを除去するためにkneaddata (https://github.com/biobakery/kneaddata) にかけた。高品質のメタトランスクリプトームリードも、リボソームRNA由来のリードを取り除くためにSortMeRNA v4.3.4 [63] にかけた。その後、分類学的プロファイリングにMetaPhlAn v3.0.13 [64]を使用した。メタゲノムおよびメタトランスクリプトームデータにおけるBGCの存在量を評価する前に、BiG-MAP [65]のスクリプトを改変して130,051個のBGCの重複を除去した。計算負荷を軽減するため、各GCF内で0.8塩基同一性閾値で重複排除を行い、24,222個の非冗長BGCが得られ、その塩基配列は参照データベースの作成に使用した。次に、Bowtie 2 v2.3.5.1 [66]を用いて、ホスト以外のメタゲノムおよびメタトランスクリプトのリードをこのBGC参照にマッピングし、パラメータを"-k 1 "とした。その後、featureCounts v2.0.3 [67](パラメータ"-T 30 -f -p -B -C -t CDS -g ID -M -O -fracOverlap 0.2" )を利用して、シーケンスリードをBGC遺伝子に割り当てました。BGCの存在量を計算する際、トランスポーター、レギュレーター、トランスポザーゼなどの他の遺伝子を除き、コアと追加の生合成遺伝子のみを考慮しました。各BGCについて、対応するGTF(General Transfer Format)アノテーションファイルがantiSMASHによって生成された。GTFファイルのgene_kindタグに従って、生合成関連遺伝子(コア生合成遺伝子は「biosynthetic」、追加生合成遺伝子は「biosynthetic-additional」タグ)を検索した。以下の基準を満たす場合、メタゲノムサンプルにBGCが存在すると判断した: (1) 検出された生合成関連遺伝子の割合が、BGCに含まれる全生合成関連遺伝子の50%以上であること (2) BGCに少なくとも一つのコア生合成遺伝子が検出されたこと。BGCの存在量は、式(1)によって計算された:
BGCの存在量=∑ki=1NiLik×N×106BGCの存在量=∑�=1���×�×106
(1)
Niは生合成関連遺伝子にマッピングされたリード数、Liは遺伝子長、kはBGC内の生合成関連遺伝子数、Nはメタゲノム/メタトランスクリプトームサンプル中の高品質非ホストリードの総数。
二次代謝産物活性の予測
BGCをコードする化合物の活性を予測するために、mlr v2.19.0 [68]を用いて機械学習を実施した。活性(抗菌、抗真菌、抗腫瘍、細胞毒性、その他の活性)が知られている950個のMIBiG BGCからなるトレーニングデータセットは、Walkerら[32]によって集められた。これらの既知のBGCのBGC特徴は、BiG-SLiCE [22]によって抽出された。モデルを学習する前に、10個未満のBGCに存在するBGC特徴を除去した。1つの分子が複数の機能を持つ可能性があるため、多クラス分類ではなく、各活性クラスに対して2クラス分類を採用した。BGC製品の活性の二値分類には、4つの二クラス分類器(すなわち、ロジスティック回帰、弾性ネット回帰、ランダムフォレスト、サポートベクターマシン)が採用された。4つの分類器の性能を最適化するために,パラメータチューニングのための入れ子式リサンプリングを行い,内側で3倍,外側で10倍のクロスバリデーションを行い,最大50回の繰り返しによるランダムサーチを採用した.これにより,各分類器に対して30個のインスタンスが生成されることになる.平均AUROCは、4つの分類器の性能を評価するために使用された。関数 generateThreshVsPerfData は,0 から 1 までの判定しきい値に対して,偽陽性率 (fpr) や真陽性率 (tpr) などの 1 つまたは複数の性能指標を計算するために使用される.各しきい値の結果として得られる fpr と tpr の値は,受信者動作特性曲線 (ROC) に描かれ,これによって分類器の性能を推定することができる.ランダムフォレストモデルを用い、129,878個のLAB由来BGCと、BGCの特徴を含む1,121,156個の非LAB由来BGCを活性予測の対象としました。BGCクラスとその生成物の予測活性との関連を示すコードダイアグラムは、Rパッケージcirclize v0.4.13 [69]を用いてプロットされた。生物種とBGCクラスとの関連を示すサンケイ図は、networkD3 v0.4パッケージにより作成した[70]。
クラスIIバクテリオシンの前駆体
クラス II バクテリオシンの前駆体を特定するために、まず Prodigal-short [71] を用いて、すべての小さな ORF を同定した。次に、hmmsearch [35]を用いて、クラスIIバクテリオシン関連ドメイン(補足表4に記載)をすべてのRiPP様BGCのORFと検索した。E-value<0.01の閾値でヒットしたものをクラスIIバクテリオシンの前駆体と見なしました。一方、BAGEL4 [36]もRiPP-like BGCからクラスIIバクテリオシンを検索するために採用された。それぞれ128,599個、90,101個の推定前駆体を検出し、30,764個が共通であった。150アミノ酸(AA)より大きい287の配列を捨て、187,649の配列を残し、さらに解析を行った。これらの配列は、Cd-hit [72]を用いて、「-n 2 -p 1 -c 0.5 -d 200 -M 50,000 -l 5 -s 0.95 -aL 0.95 -g 1」のパラメータでクラスターに分類した。50%以上の同一性を持つタンパク質は一般的に共通の機能を持つため、50%以上の同一性を持つ配列は1つのクラスターにグループ化される[73]。既知のクラスIIバクテリオシンを収集するために、NCBI PubMedで "class II bacteriocin "というキーワードでクエリを行った。一方、Yiら[15]が収集した配列や、BAGEL4データベース[36]に登録されている配列も含めた。合計333のクラスIIバクテリオシンの配列が得られた(Supplementary Table 9)。この333の配列は成熟ペプチドである可能性があるため、ローカルシーケンスアライナーDIAMOND v2.0.15 [74]を用いて、"-id 90 -query-cover 95 -masking 0" というパラメータで、333の既知のクラスIIバクテリオシンを187,649の前駆体配列に比較した。既知のクラスIIバクテリオシンは、188のクラスターに属する1,775の前駆体配列と、同一性>90%、カバー率>95%のアライメントを示し、相同であるとみなされた。選択した21の前駆体クラスターについて、EMBOSSソフトウェアパッケージの関数 "needleall "のNeedleman-Wunschアルゴリズムを用いて、既知のクラスIIバクテリオシンに対するグローバルな同一性を同定した[75]。前駆体のアライメントは、MAFFT v7.490 [76] で "-maxiterate 1000 -localpair" のパラメータで行い、Jalview ソフトウェア [77] を使って可視化した。cluster_467とcluster_468の前駆体を持つBGCの遺伝子組織を簡便に調べるために、BiG-SCAPE [24]を用いてその構造を探索した。
メタゲノム/メタトランスクリプトームサンプル中の前駆体存在量は、式(2)により算出した:
前駆体存在量=NiLi×N×106前駆体存在量=���×�×106
(2)
ここで、Niは前駆体遺伝子にマッピングされたリードの数、Liは遺伝子長、Nはメタゲノム/メタトランスクリプトームサンプル中の高品質非ホストリードの総数を表す。前駆体クラスターの存在量は、このクラスターに含まれる前駆体の存在量の合計である。
系統樹の構築
GTDBリポジトリバージョンr202 [56]には、LAB56属の代表的なゲノムが822個含まれています。各属で最大のN50長を持つゲノムを、その対応する属の代理として選択した。細菌参照樹を構築するための以前のアプローチ[56]と同様に、56の代表ゲノムの系統的に情報量の多い120のマーカー遺伝子の連結の多重配列アライメントを系統樹の推論に使用しました。IQ-TREE version 2.1.4-beta [78]は、最尤(ML)系統樹の構築に使用され、1,000回の超高速ブートストラップレプリカを使用した。内蔵のModelFinder [79]により、LG + F + R8というベストフィットモデルが特定された。推定された系統樹は、iTOL [80]を用いて可視化した。
ペプチド合成
cluster_467とcluster_468の2つの差し引きコアペプチドは、Sangon Biotech社(中国、上海)で化学合成された。その分子量は質量分析で確認し、必要な純度は高速液体クロマトグラフィーで測定したところ90%以上であった。合成したペプチド粉末は-80℃で保存し、使用時に滅菌した二重蒸留水に5 mg/mLになるように溶解させた。
細菌および真菌の菌株
本研究では、合計29の細菌株と2つの真菌株を使用した(補足表10)。それらの増殖条件は以下の通りである: 細菌2株(Escherichia coli DH5α、Staphylococcus aureus B04)はLuria-Bertani(LB)培地で37℃、180rpmの回転で培養した; 13菌株(Chromobacterium violaceum、Bacillus subtilis 168、Enterococcus faecium MCC2763、Enterococcus faecalis OG1RF, Enterococcus caccae DSM 19114, Enterococcus ureasiticus DSM 23328、 Enterococcus haemoperoxidus DSM 15920, Enterococcus silesiacus DSM 22801, Enterococcus termitis DSM 22803, Enterococcus wangshanyuanii DSM 104047, Enterococcus reborum DSM 104544, Brevibacterium senegalense DSM 25783, Rothia sp. Olga DSM 111809)をトリプティックソイブロス(TSB)培地で30℃、180rpmで振とう培養し、Bacillus timonensis DSM 25372をトリプティックソイアガー(TSA)で30℃、Lactococcus lactis subsp.cremoris MG1363をM17培地で30℃静置培養、11菌株(Streptococcus oralis subsp. tigurinus, Lactobacillus delbrueckii subsp. bulgaricus, Lactobacillus crispatus ATCC 33820, Lactobacillus acidophillus ATCC 9224, Lactobacillus casei ATCC 393, Lactobacillus fermentum ATCC 14932, Latilactobacillus sakei subsp. sakei DSM 6333、Lactiplantibacillus plantarum DSM 20174、Lactobacillus gasseri DSM 20243、Limosilactobacillus reuteri DSM 20016、Leuconostoc mesenteroides subsp. dextranicum DSM 20484)をdeMan, Rogosa and Sharpe(MRS)培地で30℃または37℃で静置培養し、Gardnerella vaginalis ATCC 14018をColombia blood agarで37℃の嫌気性条件で維持し、寒天プレートからコロニーをループいっぱいに取り、Brain heart infusion broth(BHI)中で37℃、嫌気性条件下に培養した懸濁培養を行いました; 真菌2株(Candida albicans SC5314, Candida albicans ATCC 10231)は、Roswell Park Memorial Institute(RPMI)培地で37℃、150rpmで振盪しながら培養した。
寒天ウェル拡散アッセイ
指標となる菌株は一晩培養した。固化前の20mLの対応する寒天培地に、40μL程度の微生物接種液を配合した。固化後、滅菌チップで直径約6 mmの穴を開け、10 μLのクリスパシン467および/または468を最終量0.05 mgになるようウェルに導入した。すべての寒天プレートは、対応する成長条件で1-2日間インキュベートした。
最小発育阻止濃度の測定
細菌および真菌に対する2つのペプチド[単独および組み合わせ(1:1比)]の最小発育阻止濃度(MIC)は、ブロス微量希釈法により実施した。試験した細菌株は、対応する培地(LB、M17、TSB、TSA、BHI、またはMRS)中で、それぞれの増殖条件で一晩植え付けた。細菌培養物の600nmにおける光学密度(OD600)を測定して、細菌濃度を推定した。細菌培養物は、それぞれのブロスを用いて5×105CFU/mLまで希釈した。細菌懸濁液の100μLアリコートを、ペプチドの2倍連続希釈液(200μg/mLから0.19μg/mLの範囲)を含む96ウェルプレートに移した。24時間培養後、OD600を測定することにより、細菌の増殖を評価した。また、真菌に対するMICは、CLSI M27-A3ガイドライン[81]に従って決定した。簡単に説明すると、C. albicans株をRPMI培地で一晩培養し、成長した真菌懸濁液を5,000rpmで10分間遠心分離し、ペレットを再懸濁させて1×PBSで2回洗浄し死細胞を取り除いた。真菌の接種量を分光光度計で1×106 CFU/mLに標準化し、濃度の異なるペプチド(200 μg/mL~0.19 μg/mL)を含むウェルプレートに添加した。ペプチドを含まない培地はコントロールとして機能した。その後、プレートを80rpmで振とうしながら37℃で24時間インキュベートし、SpectraMax 340 tunable microplate reader (Molecular Devices, San Jose, CA, USA) を用いて520nmの吸光度を測定した。MIC値は、細菌または真菌の増殖が検出されないペプチドの最低濃度として決定された。すべてのアッセイは、独立した3つの機会に3連で実施した。
統計解析と可視化
メタゲノムで検出された GCF の蓄積量とクラス II バクテリオシン前駆体のクラスターは、R パッケージ vegan v2.5-7 [82] の関数 specaccum を用いて計算した。異なる身体部位で検出されたGCFまたは前駆体クラスターの交点を可視化するために、RパッケージUpSetR v1.4.0 [83]を採用した。カイ二乗検定とウィルコクソン順位和検定(両側)は、それぞれ R の関数 chisq.test と wilcox.test によって行われた。膣内細菌叢のα多様性(Shannon index)は、Rパッケージvegan v2.5-7 [82]を用いて算出した。6つの身体部位で検出されたクラスIIバクテリオシンの分布を可視化するために、t-distributed stochastic neighbor embedding(t-SNE)を用いて次元削減を行い、これはRパッケージRtsne v0.15 [84] によって行われた。前駆体クラスター対細菌種間およびクラスター対シャノン指数間のスピアマンの相関は,Rパッケージ psych v2.1.9 の関数 corr.test [85] で計算し,P値は "BH" 法 [86] で調整した.本研究のヒートマップは、パッケージpheatmap v1.0.12 [87]を用いてプロットした。クラスIIバクテリオシンの類似性ネットワークと種-前駆体相関のネットワークの可視化には、Cytoscape 3.9.0 [88]を使用した。特に断りなく、他の図はggplot2 v3.3.5 [89]を用いて作成した。すべての統計解析は、R v4.1.2で終了した。
データおよび資料の入手方法
細菌ゲノムはNCBI Assembly RefSeq database (https://ftp.ncbi.nlm.nih.gov/genomes/refseq/), PATRIC database (https://docs.patricbrc.org/user_guides/ftp.html), IMG/M database (https://img.jgi.doe.gov/cgi-bin/m/main.cgi) で公開されています。ヒト腸内細菌のゲノムはEuropean Nucleotide Archiveのstudy accession ERP116715に、食品メタゲノムのゲノムはhttp://www.tfm.unina.it/DATA001-2020-Pasolli に掲載されています。ゲノムは、補足表1および5に記載されているアクセッション番号から入手することができます。HMPメタゲノム[30]と膣メタトランスクリプトーム[59]の生データは、それぞれPRJNA48479 (https://www.ncbi.nlm.nih.gov/bioproject/48479) とPRJNA797778 (https://www.ncbi.nlm.nih.gov/bioproject/?term=PRJNA797778) というバイオプロジェクトでNCBI-SRAで一般公開されています。本研究で使用したサンプルは、補足表6に記載されている。本研究の結果を裏付ける解析コードは、GitHubリポジトリ(https://github.com/ZhangDengwei/LAB_BGCs)で公開されています。
参考文献
Carr FJ, Chill D, Maida N. 乳酸菌について: 文献調査。Crit Rev Microbiol. 2002;28:281-370.
論文CAS PubMed Google Scholar
Leroy F, De Vuyst L. 食品発酵産業における機能性スターターカルチャーとしての乳酸菌。Trends Food Sci Technol. 2004;15:67-78 (Elsevier).
記事CAS Google Scholar
Teusink B, Smid EJ. 乳酸菌の産業利用のためのモデリング戦略。Nat Rev Microbiol. 2006;4:46-56 (Nature Publishing Group).
記事CAS PubMed Google Scholar
Wells JM, Mercenier A. Mucosal delivery of therapeutic and prophylactic molecules using lactic acid bacteria(乳酸菌を用いた治療・予防分子の粘膜送達)。Nat Rev Microbiol. 2008;6:349-62 (Nature Publishing Group).
記事CAS PubMed PubMed Central Google Scholar
Saez-Lara MJ, Gomez-Llorente C, Plaza-Diaz J, Gil A. The Role of Probiotic Lactic Acid Bacteria and Bifidobacteria in Prevention and Treatment of Inflammatory Bowel Disease and Other Related Disease: 無作為化ヒト臨床試験のシステマティックレビュー。Biomed Res Int. 2015;2015:1-15 (Hindawi Publishing Corporation).
記事 グーグル スカラ
Ren C, Faas MM, de Vos P. Disease managing capacities and mechanisms of host effects of lactic acid bacteria. Crit Rev Food Sci Nutr. 2021;61:1365-93 (Taylor & Francis).
記事CAS PubMed Google Scholar
García-Bayona L, Comstock LE. 宿主関連微生物群における細菌拮抗作用。Science. 2018;361:eaat2456.
ブラガRM、ドウラドMN、アラウージョWL. 微生物の相互作用:分子的観点からの生態学. Brazilian J Microbiol. 2016;47:86-98 (Sociedade Brasileira de Microbiologia).
記事CAS Googleスカラー
Delves-Broughton J, Blackburn P, Evans RJ, Hugenholtz J. バクテリオシン、ナイシンの応用例。Antonie Van Leeuwenhoek. 1996;69:193-202(シュプリンガー)。
記事CAS PubMed Google Scholar
ヒト微生物群の生合成遺伝子クラスターを系統的に解析した結果、共通の抗生物質ファミリーが明らかになった。Cell. 2014;158:1402-14 (Elsevier Inc).
記事CAS PubMed PubMed Central Google Scholar
Höltzel A, Gänzle MG, Nicholson GJ, Hammes WP, Jung G. 乳酸菌から初めて低分子化された抗生物質を発見: ロイテリシクリン、新しいテトラミックアシッド。Angew Chem Int Ed Engl. 2000;39:2766-8.
記事 PubMed Google Scholar
Acedo JZ, Chiorean S, Vederas JC, van Belkum MJ. グラム陽性菌由来のバクテリオシンの間で広がる構造的多様性。FEMS Microbiol Rev. 2018;42:805-28 (Oxford Academic).
記事CAS PubMed Google Scholar
Cotter PD, Ross RP, Hill C. Bacteriocins - a viable alternative to antibiotics? Nat Rev Microbiol. 2013;11:95-105 (Nature Publishing Group).
記事CAS PubMed Google Scholar
Heilbronner、Krismer B、Brötz-Oesterhelt H、Peschel A. バクテリオシンの微生物学的形成の役割。Nat Rev Microbiol. 2021;19:726-39.
記事CAS PubMed Google Scholar
乳酸菌由来クラスⅡバクテリオシンの現状と可能性:構造、作用機序、食品産業への応用. Trends Food Sci Technol. 2022;120:387-401 (Elsevier Ltd)。
記事CAS Googleスカラー
O'Leary NA, Wright MW, Brister JR, Ciufo S, Haddad D, McVeigh R, et al. Reference sequence (RefSeq) database at NCBI: current status, taxonomic expansion, and functional annotation. Nucleic Acids Res. 2016;44:D733-45 (Oxford Academic).
記事 PubMed Google Scholar
Wattam AR, Abraham D, Dalay O, Disz TL, Driscoll T, Gabbard JL, et al. PATRIC, the bacterial bioinformatics database and analysis resource. Nucleic Acids Res. 2014;42:D581-91 (Nucleic Acids Res).
記事CAS PubMed Google Scholar
Chen I-MA, Chu K, Palaniappan K, Ratner A, Huang J, Huntemann M, et al. IMG/M data management and analysis system v.6.0: new tools and advanced capabilities. Nucleic Acids Res. 2021;49:D751-63 (Oxford Academic).
記事CAS PubMed Google Scholar
Almeida A, Nayfach S, Boland M, Strozzi F, Beracochea M, Shi ZJ, et al. ヒト腸内細菌叢の204,938個の参照ゲノムの統一カタログを作成した。Nat Biotechnol. 2021;39:105-14 (Nature Publishing Group).
記事CAS PubMed Google Scholar
Pasolli E, De Filippis F, Mauriello IE, Cumbo F, Walsh AM, Leech J, et al. Large-scale genome-wide analysis links lactic acid bacteria from food with gut microbiome. Nat Commun. 2020;11:2610 (Springer US).
記事CAS PubMed PubMed Central Google Scholar
Blin K, Shaw S, Kloosterman AM, Charlop-Powers Z, van Wezel GP, Medema MH, et al. antiSMASH 6.0: クラスター検出および比較機能の改善。Nucleic Acids Res. 2021;49:W29-35 (Oxford Academic).
記事CAS PubMed PubMed Central Google Scholar
Kautsar SA, van der Hooft JJJ, de Ridder D, Medema MH. BiG-SLiCE: 120万個の生合成遺伝子クラスターの多様性をマップする拡張性の高いツール。Gigascience. 2021;10:1-17.
Nayfach S, Roux S, Seshadri R, Udwary D, Varghese N, Schulz F, et al. A genomic catalog of Earth's microbiomes. Nat Biotechnol. 2021;39:499-509 (Nature Publishing Group).
記事CAS PubMed Google Scholar
Navarro-Muñoz JC, Selem-Mojica N, Mullowney MW, Kautsar SA, Tryon JH, Parkinson EI, et al. A computational framework to explore large-scale biosynthetic diversity. Nat Chem Biol. 2020;16:60-8 (Nature Publishing Group).
記事 PubMed Google Scholar
Paoli L, Ruscheweyh H-J, Forneris CC, Hubrich F, Kautsar S, Bhushan A, et al. Biosynthetic potential of global ocean microbiome. Nature. 2022;607:111-8 (Nature Publishing Group).
記事CAS PubMed PubMed Central Google Scholar
Kautsar SA, Blin K, Shaw S, Navarro-Muñoz JC, Terlouw BR, van der Hooft JJJ, et al. MIBiG 2.0: a repository for biosynthetic gene clusters of known function. Nucleic Acids Res. 2020;48:D454-D458.
Brockhurst MA, Harrison E, Hall JPJ, Richards T, McNally A, MacLean C. The Ecology and Evolution of Pangenomes. Curr Biol. 2019;29:R1094-103 (Cell Press).
記事CAS PubMed Google Scholar
Gavriilidou A, Kautsar SA, Zaburannyi N, Krug D, Müller R, Medema MH, et al. Compendium of specialized metabolite biosynthetic diversity encoded in bacterial genomes. Nat Microbiol. 2022;7:726-35 (Nature Publishing Group).
記事CAS PubMed Google Scholar
ジョージ・F、ダニエル・C、トーマス・M、シンガー・E、ギルボーA、テシエ・FJ、他、異なる生態系ニッチにおける乳酸菌の存在とダイナミズム: 多面的な機能的健康の観点から。Front Microbiol. 2018;9:2899 (フロンティア).
記事 PubMed PubMed Central Google Scholar
Methé BA, Nelson KE, Pop M, Creasy HH, Giglio MG, Huttenhower C, et al. A framework for human microbiome research. ネイチャーNature. 2012;486:215-21 (Nature Publishing Group).
Google Scholar
Hannigan GD, Prihoda D, Palicka A, Soukup J, Klempir O, Rampula L, et al. A deep learning genome-mining strategy for biosynthetic gene cluster predict. Nucleic Acids Res. 2019;47:e110-e110 (Oxford Academic).
記事CAS PubMed PubMed Central Google Scholar
Walker AS, Clardy J. A Machine Learning Bioinformatics Method to Predict Biological Activity from Biosynthetic Gene Clusters. J Chem Inf Model. 2021;61:2560-71.
記事CAS PubMed PubMed Central Google Scholar
Skinnider MA, Johnston CW, Gunabalasingam M, Merwin NJ, Kieliszek AM, MacLellan RJ, et al. 微生物ゲノム配列から二次代謝物の構造と生物活性を包括的に予測した。Nat Commun. 2020;11:6058 (Nature Publishing Group).
記事CAS PubMed PubMed Central Google Scholar
Lee、Mitchell、Markley、Hensler、Gonzalez、Wohlrab、et al. 広く分布する毒素生合成遺伝子クラスターの発見。を発見した。
論文CAS PubMed PubMed Central Google Scholar
Eddy SR. 加速されたプロファイルHMM検索 Pearson WR, editor. PLoS Comput Biol. 2011;7:e1002195 (Public Library of Science).
論文CAS PubMed PubMed Central Google Scholar
van Heel AJ, de Jong A, Song C, Viel JH, Kok J, Kuipers OP. BAGEL4:RiPPsとバクテリオシンを徹底的にマイニングするためのユーザーフレンドリーなウェブサーバー。Nucleic Acids Res. 2018;46:W278-81 (Oxford Academic).
記事 PubMed PubMed Central Google Scholar
Huttenhower C, Gevers D, Knight R, Abubucker S, Badger JH, Chinwalla AT, et al. 健常人マイクロバイオームの構造、機能、多様性。Nature. 2012;486:207-14 (NIH Public Access).
記事CAS Google Scholar
緑膿菌に有効なバクテリオシンを生産するLactobacillus amylovorus DCE 471のアミロボリン遺伝子座とコリスチンおよびピロシンの組み合わせの特性評価。FEMS Microbiol Lett.2008;286:199-206. オックスフォードアカデミック
Lactobacillus gasseri SBT2055が生産するラクタシンFファミリーバクテリオシンGassericin Tの一次アミノ酸配列およびDNA配列. Biosci Biotechnol Biochem. 2000;64:2201-8.
記事CAS PubMed Google Scholar
Alvarez-Sieiro P, Montalbán-López M, Mu D, Kuipers OP. 乳酸菌のバクテリオシン:ファミリーを広げる。Appl Microbiol Biotechnol. 2016;100:2939-51 (Springer).
記事CAS PubMed PubMed Central Google Scholar
MukeshKumar M, Dhanasekaran D. antiSMASHを用いたLactobacillus種の生合成遺伝子クラスター解析。アドバンスプロバイオティクス。2021:113-20. Elsevier.
Doroghazi JR, Albright JC, Goering AW, Ju K-S, Haines RR, Tchalukov KA, et al. A roadmap for natural product discovery based on large-scale genomics and metabolomics. Nat Chem Biol Nature. 2014;10:963-8 (Nature Publishing Group).
記事CAS Googleスカラー
Argentini C, Fontana F, Alessandri G, Lugli GA, Mancabelli L, Ossiprandi MC, et al. Lactobacillus crispatus Strains in Context of the Vaginal Microbiotaの調節活性の評価. Microbiol Spectr. 2022;10:e02733-21.
Fontana F, Alessandri G, Lugli GA, Mancabelli L, Longhi G, Anzalone R, et al. Probiogenomics Analysis of 97 Lactobacillus crispatus Strains as a Tool for the Identification of Promising Next-Generation Probiotics. Microorganisms. 2020;9:73.
記事 PubMed PubMed Central Google Scholar
田原俊彦、金谷耕一.Lactobacillus crispatus JCM 2009が生産する細胞関連バクテリオシン、クリスパシンAの単離と部分的特性評価。FEMS Microbiol Lett. 2006;147:287-90 (Oxford Academic).
記事 Google Scholar
Skarin A, Sylwan J. 細菌性膣炎女性の膣内容物から培養したGardnerella vaginalis, Mobiluncusおよび他の細菌種の増殖を抑制する膣乳酸菌の効果。Acta Pathol Microbiol Scand Ser B Microbiol. 2009;94B:399-403 (John Wiley & Sons, Ltd)。
Google Scholar
France M, Alizadeh M, Brown S, Ma B, Ravel J. 膣内細菌叢の深い理解へ向けて。Nat Microbiol. 2022;7:367-78 (Springer US).
記事CAS PubMed PubMed Central Google Scholar
Suez J, Zmora N, Segal E, Elinav E. The pros, cons, and many unknowns of probiotics. Nat Med. 2019;25:716-29.
記事CAS PubMed Google Scholar
ソルバラMT、パマーEG。微生物に基づく治療法。Nat Rev Microbiol. 2022;20:365-80 (Nature Publishing Group).
記事CAS PubMed Google Scholar
Plavec TV, Berlec A. 治療用タンパク質およびペプチドの送達を目的とした乳酸菌のエンジニアリング。Appl Microbiol Biotechnol. 2019;103:2053-66 (Springer Verlag).
記事CAS PubMed Google Scholar
モコエナMP. 乳酸菌とそのバクテリオシン: 分類、生合成および尿路病原体に対する応用: A Mini-Review. Molecules. 2017;22:1255 (Multidisciplinary Digital Publishing Institute (MDPI)).
記事 PubMed PubMed Central Google Scholar
鄭J、Wittouck S、Salvetti E、Franz CMAP、Harris HMB、Mattarelli P, et al. Lactobacillus属に関する分類学的注釈: ラクトバチルス属の分類学的注釈:23の新規属の記述、Lactobacillus Beijerinck 1901属の修正記述、LactobacillaceaeとLeuconostocaceaeの結合。Int J Syst Evol Microbiol. 2020;70:2782-858.
論文CAS PubMed Google Scholar
Ondov BD, Treangen TJ, Melsted P, Mallonee AB, Bergman NH, Koren S, et al. Mash: Fast genome and metagenome distance estimation using MinHash. Genome Biol. 2016;17:132 (BioMed Central Ltd).
記事 PubMed PubMed Central Google Scholar
Chaumeil P-A, Mussig AJ, Hugenholtz P, Parks DH. GTDB-Tk:ゲノム分類データベースを用いてゲノムを分類するためのツールキット。Hancock J, editor. Bioinformatics. 2019;36:1925-7 (Oxford Academic).
PubMed PubMed Central Google Scholar
Parks DH, Chuvochina M, Rinke C, Mussig AJ, Chaumeil P-A, Hugenholtz P. GTDB: an ongoing census of bacterial and archaeal diversity through a phylogenetically consistent, rank normalized and complete genome-based taxonomy. Nucleic Acids Res. 2022;50:D785-94 (Oxford Academic).
記事CAS PubMed Google Scholar
ゲノム系統樹に基づく標準化された細菌分類法は、生命の樹を大幅に改訂する。Nat Biotechnol. 2018;36:996-1004 (Nature Publishing Group).
記事CAS PubMed Google Scholar
SciPy 1.0:Pythonによる科学計算のための基本アルゴリズム。Nat Methods. 2020;17:261-72 (Nature Publishing Group).
記事CAS PubMed PubMed Central Google Scholar
Pedregosa F, Varoquaux G, Gramfort A, Michel V, Thirion B, Grisel O, et al. Scikit-learn: Pythonで機械学習。J Mach Learn Res. 2011;12:2825-30.
Google Scholar
France MT, Fu L, Rutt L, Yang H, Humphrys MS, Narina S, et al. Insight into ecology of vaginal bacteria through integrative analyses of metagenomic and metatranscriptomic data. Genome Biol. 2022;23:66 (BioMed Central).
記事CAS PubMed PubMed Central Google Scholar
Leinonen R, Sugawara H, Shumway M. The Sequence Read Archive. Nucleic Acids Res. 2011;39:D19-21 (Oxford University Press).
記事CAS PubMed Google Scholar
Fastp:超高速オールインワンFASTQプリプロセッサー。バイオインフォマティクス(Bioinformatics). 2018;34:i884-90.
記事 PubMed PubMed Central Google Scholar
Frankish A, Diekhans M, Ferreira A-M, Johnson R, Jungreis I, Loveland J, et al. GENCODE reference annotation for the human and mouse genomes. Nucleic Acids Res. 2019;47:D766-73.
記事CAS PubMed Google Scholar
Kopylova E, Noé L, Touzet H. SortMeRNA: メタトランスクリプトームデータにおけるリボソームRNAの高速かつ正確なフィルタリング。Bioinformatics. 2012;28:3211-7 (Oxford Academic).
論文CAS PubMed Google Scholar
Beghini F, McIver LJ, Blanco-Míguez A, Dubois L, Asnicar F, Maharjan S, et al. bioBakery 3による多様な微生物群集の分類学、機能、株レベルのプロファイリングの統合。Elife. 2021;10:e65088.
Pascal Andreu V, Augustijn HE, van den Berg K, van der Hooft JJJ, Fischbach MA, Medema MH. BiG-MAP: an Automated Pipeline To Profile Metabolic Gene Cluster Abundance and Expression in Microbiomes. Shank EA, editor. mSystems. 2021;6:e00937-21.
Langmead B, Salzberg SL. Bowtie 2による高速ギャップドリードアライメント。Nat Methods. 2012;9:357-9.
論文CAS PubMed PubMed Central Google Scholar
Liao、Smyth GK、Shi W. featureCounts: an efficient general purpose program for assigning sequence reads to genomic features. Bioinformatics. 2014;30:923-30.
記事CAS PubMed Google Scholar
Bischl B, Lang M, Kotthoff L, Schiffner J, Richter J, Studerus E, et al. mlr: Machine Learning in R. J Mach Learn Res. 2016;17:1-5.
グーグル・スカラー
Gu Z, Gu L, Eils R, Schlesner M, Brors B. circlize implements and enhance circular visualization in R. Bioinformatics Oxford Academic. 2014;30:2811-2.
記事CAS Googleスカラー
Allaire JJ, Ellis P, Gandrud C, Kuo K, Lewis BW, Owen J, et al. パッケージ "networkD3". 2017.
グーグル スカラー
Santos-Aberturas J, Chandra G, Frattaruolo L, Lacret R, Pham TH, Vior NM, et al. Uncovering the unexplored diversity of thioamidated ribosomal peptides in Actinobacteria using the RiPPER genome mining tool. Nucleic Acids Res. 2019;47:4624-37 (Oxford Academic).
記事CAS PubMed PubMed Central Google Scholar
Cd-hit: a fast program for clustering and comparising large set of protein or nucleotide sequences. Bioinformatics. 2006;22:1658-9 (Oxford Academic).
論文CAS PubMed Google Scholar
Sangar V, Blankenberg DJ, Altman N, Lesk AM. 遺伝子オントロジーに基づくタンパク質の定量的な配列-機能関係。BMC Bioinformatics. 2007;8:294 (BioMed Central).
記事 PubMed PubMed Central Google Scholar
Buchfink B, Reuter K, Drost H-G. DIAMONDを用いた生命の木スケールでの高感度タンパク質アラインメント。Nat Methods. 2021;18:366-8 (Nature Publishing Group).
記事CAS PubMed PubMed Central Google Scholar
EMBOSS: The European Molecular Biology Open Software Suite. Trends Genet. 2000;16:276-7 (Elsevier).
論文CAS PubMed Google Scholar
加藤和彦、Standley DM. MAFFT Multiple Sequence Alignment Software Version 7: Improvements in Performance and Usability. Mol Biol Evol. 2013;30:772-80 (Oxford Academic).
記事CAS PubMed PubMed Central Google Scholar
ウォーターハウス AM、プロクター JB、マーティン DMA、クランプ M、バートン GJ。Jalview Version 2-a multiple sequence alignment editor and analysis workbench. Bioinformatics. 2009;25:1189-91 (Oxford Academic).
論文CAS PubMed PubMed Central Google Scholar
IQ-TREE 2: New Models and Efficient Methods for Phylogenetic Inference in Genomic Era, et al. Teeling E, editor. Mol Biol Evol. 2020;37:1530-4.
記事CAS PubMed PubMed Central Google Scholar
Kalyaanamoorthy S, Minh BQ, Wong TKF, von Haeseler A, Jermiin LS. ModelFinder:正確な系統推定を行うための高速モデル選択。Nat Methods. 2017;14:587-9.
記事CAS PubMed PubMed Central Google Scholar
Letunic I, Bork P. Interactive Tree Of Life (iTOL) v4: 最近のアップデートと新しい展開。Nucleic Acids Res. 2019;47:W256-9.
記事CAS PubMed PubMed Central Google Scholar
臨床検査標準協会(Clinical and Laboratory Standards Institute)。酵母のブロス希釈抗真菌剤感受性試験のための参照法。承認規格 M27-A3. 2008;22:1-25.
Oksanen J, et al. Vegan: ecological diversity. R Proj. 2013;368:1-11.
Google Scholar
Conway JR, Lex A, Gehlenborg N. UpSetR: an R package for visualization of intersecting sets and their properties. Hancock J, editor. Bioinformatics. 2017;33:2938-40 (Oxford Academic).
記事CAS PubMed PubMed Central Google Scholar
Krijthe J、van der Maaten L、Krijthe MJ.パッケージ「Rtsne. R Packag version 013 2017. https://github.com/jkrijthe/Rtsne. 2018.
レヴェルW、レヴェルMW. パッケージ 'psych.'. Compr R Arch Netw. 2015;337:338.
グーグル スカラー
Benjamini Y, Hochberg Y. 偽発見率を制御する: 多重検定への実用的で強力なアプローチ。J R Stat Soc Ser B. 1995;57:289-300.
Google Scholar
Kolde R, et al. Pheatmap: pretty heatmaps. R Packag version. 2012;1:726.
Google Scholar
Shannon P, Markiel A, Ozier O, Baliga NS, Wang JT, Ramage D, et al. Cytoscape: 生体分子間相互作用ネットワークの統合モデルのためのソフトウェア環境。ゲノム研究 2003;13:2498-504.
論文CAS PubMed PubMed Central Google Scholar
Villanueva RAM, Chen ZJ. ggplot2: elegant graphics for data analysis. Meas: Interdiscip Res Perspect. 2019;17:160-7.
参考文献のダウンロード
謝辞
L. lactis株を提供していただいた南開大学のMingqiang Qiao博士とWanjin Qiao氏に感謝する。
資金提供
本研究は、深圳基礎研究総合プログラム(JCYJ20210324122211031)および2つの香港研究助成委員会総合研究助成(HKU27107320およびHKU17115322)により一部資金提供されています。
著者情報
著者と所属
香港大学化学学部およびスワイヤー海洋科学研究所(中国・香港、ポクフラムロード
張德威、張建、劉静、宋志萬、何北、蔡佩燕、中正、李永信
香港大学歯学部歯科修復科学科(中国・香港
シャンティニ・カリムトゥ&プラサナ・ニーラカンタン
復旦大学華山病院泌尿器科、200040、中国上海市
チェンチェン・フェン
貢献度
Y.-X.L.とD.Z.は、本研究を発案し、その設計と調整に参加し、原稿を起草した。D.Z.とJ.Z.は、この研究で使用された公開データを収集した。D.Z.とS.K.はMIC判定を行った。J.L.、Z.S.、B.H.、P.C.は、細菌の培養と代謝分析を行った。D.Z.、J.Z.、Z.Z.、Y.-X.L.はデータ解析と解釈を行った。C.F.とP.N.はアドバイスを提供した。Y.-X.L.は、プロジェクトの全体的な監督に携わった。すべての著者が最終原稿を読み、修正し、承認した。
筆頭著者
Yong-Xin Liに対応します。
倫理に関する宣言
倫理的承認と参加への同意
該当事項はありません。
掲載の同意について
該当事項はありません。
競合する利益
著者は、競合する利害関係を宣言していない。
追加情報
出版社ノート
シュプリンガー・ネイチャーは、出版された地図や所属機関の管轄権主張に関して、中立を保っています。
補足情報
追加ファイル1:補足表1.
本研究で収集したLABゲノム。補足表2. 31977個のLABゲノムのリスト。補足表3. 130051 LAB BGCのリスト。補足表4. バクテリオシン関連ドメインの情報。補足表5. 3805の非LAB属のリスト。補足表6. 本研究で使用したメタゲノム、メタトランスクリプトームデータ一覧。補足表7. トレーニングデータセットとして採用した950の既知BGCの情報。補足表8. クラスIIバクテリオシンの推定前駆体。補足表9. クラスIIバクテリオシン333種のリスト。補足表10. 寒天ウェル拡散アッセイにおける31の指標菌株に対するクリスパシンの阻害スペクトル。
追加ファイル2:補足図1.
データ処理の概要。補足図2. MAGとSAGから同定されたBGCの数。補足図3. 72,471個のRiPP様BGCから同定されたバクテリオシンの個数。補足図4. LAB種における生合成の可能性。補足図5. SAGにおけるBGC数および割合の中央値。補足図6. LABにおけるBGCの割合とカウントの比較。補足図7. LAB属と非LAB属のSM BGC能の比較。補足図8. 2,849個のGCFの分布。補足図9. 212のクロス属GCFの多様性。補足図10. 88のクロスゲノムRiPP-like GCFのドメイン分布。補足図11. BGCは6つの身体部位に多く存在する。補足図12. トレーニングデータにおける活性の異なる参照用BGCの分布。補足図13. BGCをコードする化合物の活性を判定するための4つの分類器の性能。補足図14. LAB属のBGCの予測化合物活性のプロファイル。補足図15. 細胞毒性および抗真菌性の予測活性を示す。補足図16. 前駆体ペプチドの配列類似性ネットワークから、クラスIIバクテリオシン候補の巨大な多様性が明らかになった。補足図17. クラスIIバクテリオシンの6つの身体部位における有病率が変化している。補足図18. cluster_467とcluster_468の前駆体を保有するBGC。補足図19. 合成されたペプチドのHR-LCMS分析。
権利と許可
オープンアクセス この記事は、クリエイティブ・コモンズ 表示 4.0 国際ライセンスの下でライセンスされています。このライセンスは、原著者と出典に適切なクレジットを与え、クリエイティブ・コモンズ・ライセンスへのリンクを提供し、変更があった場合にそれを示す限り、あらゆる媒体や形式での使用、共有、適応、配布および複製を許可します。この記事に掲載されている画像やその他の第三者の素材は、素材へのクレジット表示で別段の指示がない限り、記事のクリエイティブ・コモンズ・ライセンスに含まれています。素材が記事のクリエイティブ・コモンズ・ライセンスに含まれておらず、あなたの意図する使用が法的規制によって許可されていない場合、または許可された使用を超える場合、あなたは著作権者から直接許可を得る必要があります。このライセンスのコピーを見るには、http://creativecommons.org/licenses/by/4.0/。クリエイティブ・コモンズ・パブリック・ドメインの献呈放棄(http://creativecommons.org/publicdomain/zero/1.0/)は、データへのクレジット表記がない限り、この記事で利用可能になったデータにも適用されます。
転載と許可
この記事について
この記事を引用する
Zhang, D., Zhang, J., Kalimuthu, S. et al. A systematically biosynthetic investigation of lactic acid bacteria reveals diverse antagonistic bacteriocins that potentially shape the human microbiome. Microbiome 11, 91 (2023). https://doi.org/10.1186/s40168-023-01540-y
引用元:ダウンロード
2022年7月18日受理
2023年3月31日受理
2023年4月27日発行
DOIhttps://doi.org/10.1186/s40168-023-01540-y
この記事を共有する
以下のリンクを共有した人は、このコンテンツを読むことができるようになります:
共有リンクを取得する
コンテンツ共有イニシアティブ「Springer Nature SharedIt」により提供されます。
キーワード
乳酸菌
生合成遺伝子クラスター
二次代謝産物
バクテリオシン(Bacteriocins
ヒトマイクロバイオーム
膣内マイクロバイオーム
マイクロビオーム
ISSN: 2049-2618
お問い合わせ
投稿に関するお問い合わせ: lyndie.manicani@springernature.com
一般的なお問い合わせ先: info@biomedcentral.com
ブログで詳しく見る
BMCのニュースレターを受信する
記事アラートの管理
著者のための言語編集
著者のための科学編集
ポリシー
アクセシビリティ
プレスセンター
サポート・お問い合わせ
フィードバックを残す
採用情報
BMCをフォローする
BMCのTwitterページ
BMCのFacebookページ
BMC Weiboページ
このウェブサイトを使用することで、当社の利用規約、カリフォルニア州プライバシーステートメント、プライバシーステートメント、およびクッキーポリシーに同意したことになります。クッキーを管理する/私たちはプリファレンスセンターで使用する私のデータを販売しないでください。
© 2023 BioMed Central Ltd 特に断りのない限り、BioMed Central Ltd。シュプリンガー・ネイチャーの一部です。

この記事が気に入ったらサポートをしてみませんか?