バクテロイデス・フラギリス(Bacteroides fragilis)グループにおいて、ロービング・メチル転移酵素がモザイク状のエピジェネティック・ランドスケープを生成し、進化に影響を及ぼす


オープンアクセス
公開:2023年7月10日
バクテロイデス・フラギリス(Bacteroides fragilis)グループにおいて、ロービング・メチル転移酵素がモザイク状のエピジェネティック・ランドスケープを生成し、進化に影響を及ぼす

https://www.nature.com/articles/s41467-023-39892-6?utm_source=dlvr.it&utm_medium=twitter


マイケル・J・ティーザ
デレク・D・N・スミス
NISC比較シーケンスプログラム、
...
ジョン・P・デッカー
著者を表示する
ネイチャーコミュニケーションズ14巻、論文番号:4082(2023) この記事を引用する
8 Altmetric
メトリクス詳細
概要
細菌ゲノムからは3種類のDNAメチル修飾が検出されており、ファージ防御から病原性や宿主-病原体相互作用の転写制御まで、生理学的機能におけるDNAメチル化の役割がメカニズム研究によって明らかにされている。メチル基転移酵素の偏在性とメチル化パターンの多様性にもかかわらず、エピゲノムの多様性はほとんどの細菌種で未解明のままである。バクテロイデス・フラジリス(BFG)グループのメンバーは、共生社会の重要な担い手としてヒトの消化管に生息しているが、嫌気性感染症を引き起こすこともあり、その多剤耐性化はますます進んでいる。本研究では、40年以上にわたってNIH臨床センターで認められた感染症から培養された臨床BFG分離株のパンゲノム解析(n=383)およびパネピゲノム解析(n=268)を、ロングリードシーケンス技術を用いて行った。解析の結果、単一のBFG種が数百のDNAメチル化モチーフを保有し、ほとんどの個々のモチーフの組み合わせが単一の分離株で特異的に生じることが明らかになり、BFGエピゲノム内のサンプリングされていない膨大なメチル化の多様性が示唆された。BFGゲノムのマイニングにより、6000以上のメチル化酵素遺伝子が同定され、そのうち約1000は無傷のプロファージと関連していた。ネットワーク解析の結果、異種ファージゲノム間の実質的な遺伝子フローが明らかになり、BFGエピゲノムの多様性を促進する最終的な原因の一つとして、BFGファージ間の遺伝子交換の役割が示唆された。
はじめに
ゲノムDNAのメチル化は、ウイルスだけでなく、細胞生命の3つの領域すべてで検出されている1,2,3。真核生物のゲノムは、特定のCpG(5'-CG-3')コンテクスト内のC5位(5mC)のシトシンの動的なメチル化を示し、特定の部位におけるこのCpGメチル化の制御は、転写4、ゲノム修復ダイナミクス、ゲノムコンパクションに影響を与える5。対照的に、細菌はモチーフ特異的なDNAメチル化(例えば、5'-CC-6mA-TGG-3')を示し、あるモチーフのほぼ全てのインスタンスがメチル化されている可能性がある6。真核生物ゲノムと同様、5mCの修飾が一般的であるが、細菌ゲノムではシトシンのN4位(4mC)、そして最も一般的なのはアデニンのN6位(6mA)にもメチル化が見られる6。細菌のDNAメチル化はDNAメチル化酵素によって行われるが、そのうちのいくつかは、ある種のすべての菌株に存在し、活性を示す(例えば、大腸菌のGATCを修飾するDam)。古典的には、細菌のDNAメチル化は主に制限修飾系に基づく抗ファージ防御の副産物として理解されてきた8。しかし、数千の遺伝子座でメチル化されたDNAが維持されることによる、その他の生理学的影響も明らかになりつつある。真核生物系での観察と同様に、病原性表現型9,10,11やその他の生理学的プログラム12,13を制御する転写活性の制御、ゲノムの安定性14,15、メチル化モチーフ内の変異頻度に影響を与える16,17などにおいて、細菌のDNAメチル化が果たす役割が研究によって証明されている。
バクテロイデス・フラジリスグループ(BFG)に属する細菌は、バクテロイデス属、パラバクテロイデス属、そして最近登場したフォカエイコラ属の10数種を代表する18。これらの豊富な共生細菌は、ヒトの消化管内で嫌気的に生きていることが容易に確認され、多くの重要な代謝機能や免疫機能に関与していることが示唆されている19,20,21。また、腸管外の嫌気性感染症から最もよく回収される細菌のひとつであり、セファロスポリン系やカルバペネム系を含む多くの抗生物質に対する耐性が高まっている22,23。その幅広い表現型は、相変化、多糖類利用遺伝子座の配列、反転可能なプロモーターの使用などによって可能になる24,25。
本研究では、40年にわたるBFGの歴史的コレクションから分離された臨床株を、ショートリードおよびロングリードのゲノム配列決定、メチローム解析、抗菌薬感受性表現型分類を併用して研究した。本研究で実施されたメチローム解析の包括的な範囲と、連続したロングリードのアセンブリーとの組み合わせにより、臨床BFG分離株におけるエピジェネティックなランドスケープが、これまで評価されていなかった膨大な多様性を持つことが明らかになった。5mC、4mC、6mAを含む数百のDNAメチル化モチーフがゲノム全体で同定され、ほぼ全てのモチーフの組み合わせが単一分離株でのみ観察された。いくつかのDNAメチル化モチーフは、1つの生物種内の特定の系統で強く濃縮され、これらのモチーフ配列のゲノム全体にわたる枯渇の証拠が、これらの同じ系統で頻繁に観察された。
研究結果
BFG臨床分離株383株の歴史的コレクションの詳細な特性解析
米国メリーランド州ベセスダのNIH臨床センターで患者の日常診療の過程で培養された600以上の臨床BFG分離株が、1973年から2018年の間に収集され、凍結保存された。このコレクションから、さまざまな年代、菌種、抗菌薬耐性プロファイルを代表する383株の分離株セットを選択した。分離株のゲノムは、ロングリードナノポアシークエンシングで配列決定され(n = 383)、代表的なサブセット(n = 13)にはPacBio SMRTシーケンシングが追加された(補足データ1)。ゲノムのde novoアセンブリーを行ったところ、68.1%(261/383)の分離株で、染色体は3.9~7.2メガバスの長さの単一の円形コンティグとしてアセンブルされた(補足図1A)。アセンブリーの質を評価したところ、これらのアセンブリーでは長い反復領域が分離できることが示された。例えば、βラクタマーゼ遺伝子であるcfxAを持つ12キロ塩基(kb)のトランスポゾンTn4555のタンデムコピーと非タンデムコピーを10個以上含む分離株もあり26、ロングリードアプローチにより、これらの繰り返しのコピー数とゲノム上の位置を解析することができた(補足図1B)。さらに、環状化ゲノムを解析した結果、3〜7個のrRNAオペロン(それぞれ5 kb以上)がアセンブリーで検出された(補足図1C)。円形染色体あたり同定されたrRNAオペロンの数は、Ribosomal RNA Database27のデータに基づくと、ほぼすべてのケースでその種の期待値と一致した。
各単離株の分類は2つの方法で調べた。まず、Bruker Biotyper28,29を使用して、MALDI-TOF質量分析法により細菌の溶解物を分析した。次に、ゲノム配列にGTDB-Tk30を使用し、それぞれを種レベルのビンに分類した(図1)。これらの方法はほぼ一致し、360/383の分離株ゲノム(94.0%)で一致したが、最終的な種指定の数は異なり、MALDI-TOFでは15種、GTDB-Tkでは21種が同定された。これらの不一致は、GTDB-Tkがより新しい分類構造を使用しており、関連するいくつかの種/属が分裂しているという事実によって一部説明される。Bruker Biotyperによる同定に基づくと、Bacteroides fragilis sensu strictoが分離株セットで最も一般的な種であり、135のユニークな種レベルの同定に寄与し、Bacteroiodes thetaiotaomicron(n = 80)、Bacteroides ovatus(n = 51)、Bacteroides vulgatus(n = 32)がそれに続いた(Methods参照)。このデータセットの遺伝的多様性は、全分離株ゲノム間のペアワイズ塩基類似度距離によって可視化され(補足図2)、明確な種レベルのクラスタリングを示した。なお、Phocaeicola vulgatusという名称は、Bacteroides vulgatus(B.vulgatus)に対して最近提案され、受け入れられている29。本稿では、既存文献の多くとの整合性を保つため、B. vulgatusの名称をそのまま使用する。
図1:NIHクリニカルセンターで40年間収集されたBFGの臨床分離株。
本研究で塩基配列を決定したBFGゲノムをGenbank参照ゲノムで補足したMLSTマーカー遺伝子クラドグラム(n = 合計462)。分類の割り当てはMALDI-TOF質量分析(Bruker Biotyper)でプロテオーム的に、GTDB-Tkでゲノム的に定義した。"Source "および "Decade "データは臨床検査室のメタデータ記録から抽出した。
フルサイズ画像
324株の配列決定された分離株について、7種類の抗生物質(アンピシリン、アンピシリン/スルバクタム、ピペラシリン/タゾバクタム、メロペネム、メトロニダゾール、モキシフロキサシン、クリンダマイシン、テトラサイクリン)に対する抗菌薬感受性試験を基準寒天希釈法で行った(図1および補足データ2)。この検査では、各菌種の分離株間で不均一かつ複雑な耐性パターンが示されたが、最近の10年間に分離された株は、他の発表された研究23,29と同様の耐性パターンを示した。先行研究と一致して、ピペラシリン・タゾバクタムやメロペネムを含むいくつかの抗生物質に対する耐性が、1980年代から2010年代にかけて、B. fragilisやB. ovatusなどの特定の種で増加しているようであることがわかった(補足図3A)。このことは、同時期に特定の抗菌薬耐性遺伝子が増加していることからもある程度裏付けられている(補足図3B)。
ゲノム解析の結果、パンゲノムは開いており、BFG種内および種間で移動性遺伝要素がかなり移動していることが明らかになった。
本研究で得られた8種のパンゲノム解析31にGenBank参照ゲノムを追加した結果、各生物種のアクセサリー(雲と殻)遺伝子ファミリーは、全遺伝子量の29.0%(Bacteroides faecis)から42.2%(B. ovatus)までばらつきがあることが明らかになった(図2a)。さらに、希少化解析(図2b)およびヒープの法則による推定(補足表1)は、データセット中に20,000を超えるサンプリング遺伝子を含む種があることから、各生物種のパンゲノムはオープンなままであることを示し、BFG内にはさらに膨大な数の遺伝子ファミリーが発見されるのを待っていることを示唆した。このパンゲノムのオープン性は、腸由来のBacteroidesメタゲノム32とほぼ一致している。
図2:ゲノム解析により、パンゲノムはオープンであり、種内および種間で移動性遺伝要素がかなり移動していることが示された。
b BFG種のサブセットに対するパンゲノム解析。レアファクション曲線は、配列決定されたセットにわたってパンゲノムが開いていることを示し、3つの最大のパンゲノムはそれぞれ20,000遺伝子以上を示している。上部パネルは、33,000以上のアクセサリー領域/可動遺伝要素について、種レベルの広がりを示す。「種」は、示された数のアクセサリー領域または可動遺伝要素を共有する種の数を示す。対になった下パネルのバーチャートは、上パネルの各対になった広がりレベルのビンに占める割合として、アクセサリー領域の注釈付き特徴を示している。
フルサイズ画像
ゲノムや種を越えた遺伝子や移動性遺伝要素の流れを理解するために、3つ以上のゲノムが利用可能な13種を代表する414ゲノム(本研究の378ゲノムとNCBIの36ゲノム)から31,436のアクセサリー領域(アクセサリー遺伝子のみをコードする長さ3kbを超えるDNA配列、補足データ3)を抽出した33。各アクセサリー領域の配列をこのセットの他のすべての配列と比較すると、そのような領域の10%以上が種間で共有されていることが示され、水平転移が示唆された(図2c)。各アクセサリー領域について様々な特徴を調べたところ、ファージ、ファージ防御システム、DNAメチル化酵素、結合装置、エピソーム/プラスミド、抗菌薬耐性(AMR)遺伝子はすべて、3種以上で検出されたアクセサリー領域でより一般的であることがわかった(図2c)。例えば、テトラサイクリン耐性遺伝子tet(Q)やtet(X)1、tet(X)2、アミノグリコシド修飾酵素aadSをコードするアクセサリー領域は、解析した13種中12種で検出され(図2および補足図4)、テトラサイクリンやアミノグリコシド化合物による選択圧の歴史を裏付けていると考えられる。
エンテロバクター属や関連するガンマプロテオバクテリアなど、医療上重要な病原性細菌の多くは、AMR遺伝子の大部分をプラスミド上に染色体外に保持している34。今回解析したデータセットでは、配列決定された383の分離株ゲノム全体で575の完全な環状プラスミドまたはエピソームが得られ(補足データ4)、平均塩基同一性が95%を超える85のクラスターに属していた(Methods参照)(補足図5A)。円形コンティグの大部分(575個中550個;95.7%)は、レプリカーゼやリラクサーゼのような認識可能なプラスミド遺伝子を有しており(Methods参照)、残りの一部はトランスポゾンの複製中間体である可能性があるが、これ以上の解析は行わなかった。配列決定データにはプラスミド/エピソームとAMR遺伝子の両方が遍在しているにもかかわらず、BFG種ではこれらのAMR遺伝子のほとんどがプラスミド/エピソーム上には存在しないことがわかった(1911個のAMR遺伝子のうち53個が環状プラスミド/エピソームコンティグ内に存在)。AMR遺伝子の圧倒的多数(97.2%以上)は染色体中に存在し、その多くは統合要素と関連していた23。プラスミド/エピソームがコードするAMR遺伝子の多くも、プラスミドバックボーンへの統合エレメントの統合と関連しているようで、染色体とプラスミド/エピソーム間でAMR遺伝子がシャトリングしている可能性と一致した(補足図5B)。
DNAメチル化酵素は、アクセサリーゲノムに驚くほど多様かつ豊富に存在する
DNAメチル基転移酵素は、多くの細菌種でグローバルな制御因子の一種として機能している可能性があると考えられている7。メチルトランスフェラーゼは通常、細菌ゲノムの遺伝子内領域や遺伝子本体に広く散在する数千の部位に存在する短いモチーフでDNAを修飾するので、単一のメチルトランスフェラーゼ遺伝子の発現が、ひいてはグローバルなメチル化状態を制御している可能性がある。遺伝子内および遺伝子間部位におけるメチル化は、転写プログラムに影響を与え、細菌の表現型を調整することが知られている9,10,11,12,13。細菌メチル化酵素遺伝子のかなりの割合が、特に細菌ゲノムのアクセサリー領域内の移動性遺伝要素に関連していることが観察されている35,36。BFGゲノムデータにおけるメチル基転移酵素の同定を容易にするために、我々は、これまでの隠れマルコフモデルアプローチ37を基に、DNAメチル基転移酵素遺伝子とそれらが属する遺伝子近傍を検出し、アノテーションするための一般にアクセス可能なツール、DNA Methylase Finderを開発した(https://github.com/mtisza1/DNA_methylase_finder)。メチル化モチーフをアノテーションしたREBASEデータセットを用いたこのツールのベンチマーク研究では、100%の感度と5.4%までの偽陽性率が観察された(Methodsを参照)。
DNA Methylase Finderを用いると、6011個のDNAメチル化酵素遺伝子が462個のBFGゲノム(本研究のゲノムにGenBankからダウンロードした追加のBFGゲノムを加えた)から検出された(補足データ5)。これらの遺伝子は536のファミリーに分類され(Supplementary Data 6)(Methodsを参照)、すべての既知のタイプ(タイプI、タイプII、タイプIIG、タイプIII、および "unknown "と表示された分類できないDNAメチル化酵素)を表していた。DNAメチル基転移酵素遺伝子ファミリーは、これらの種のパンゲノムの持続性、殻、雲に存在し、幅広い移動性を示した(図3)。図3の解析対象15種に属する5480個のDNAメチル化酵素遺伝子のうち、720個(13.1%)がコアパーティションに、2385個(43.5%)がシェルパーティションに、2375個(43.3%)がクラウドパーティションに存在した。
図3:DNAメチル化酵素は、BFG種のアクセサリーゲノムに驚くほど多様かつ豊富に存在する。
宿主生物種は、上段を四角で囲んだ(面積は解析したゲノム数に比例)。DNAメチル化酵素遺伝子ファミリー(80%AAI、80%AF)は、下の矩形格子で塗りつぶした円(面積はファミリー内の遺伝子数に比例)で表し、色はキーで示した。エッジは、種内の1つ以上のゲノムにコードされているDNAメチル化酵素遺伝子ファミリーを持つ種を結んでいる。コア、シェルまたはクラウドゲノム中の所定のメチル基転移酵素遺伝子ファミリーの位置はエッジの色で示され、エッジの太さはその遺伝子ファミリーが種のゲノムにコードされている回数を示す。この解析では、「コア」は種のゲノムの90%以上に存在、「シェル」は種のゲノムの10%以上90%以下に存在、「クラウド」は種のゲノムの10%未満に存在と定義した。
フルサイズ画像
この方法で同定されたメチル基転移酵素の数は、過去の報告に基づいて予想されるよりも多いかもしれない。また、REBASEデータベースと比較した場合、この手法による偽陽性発見率は最大5.4%であった。しかしながら、多くのゲノムにはほぼ同じ配列のメチル化酵素が複数存在し、その多くは移動性遺伝要素に関連していた。従って、この数の多さは、トランスポゾンの挿入による重複によって一部説明できるかもしれない。ショートリードシーケンスに基づく研究では、メチル基転移酵素の重複の数が、アセンブリー中の崩壊によって過小評価されている可能性がある。単離株BFG-632がコードする38の推定メチル基転移酵素(補足データ7)をBlastPで検索したところ、37/38が以前に同定されたDNAメチル基転移酵素と90%以上のアミノ酸同一性を示した。興味深いことに、解析の過程で、それぞれの生物種において、ゲノムサイズと推定DNAメチル化酵素の数には正の相関があることが観察された(補足図6)。BFG-632は全コレクションの中で最も長いゲノムであり、メチル化酵素の数が最も多いことと一致している。
同定されたDNAメチル化酵素の上流と下流の遺伝子を追加アノテーションしたところ、特異性サブユニットが検出されたのは、ほとんどI型DNAメチル化酵素の近くだけであることが示された(補足図7A)。さらに、制限エンドヌクレアーゼは、推定タイプIII DNAメチル転移酵素の100%の近傍で検出され、ほとんどのタイプII DNAメチル転移酵素は、近傍の制限エンドヌクレアーゼが同定されない、明らかな孤児である(補足図7B)。これらの付加的な特徴は、多くのメチル基転移酵素同定の信頼性を高めている。
ネットワーク解析により、異種ファージ間でメチル基転移酵素遺伝子の大きな流れがあることが明らかになった。
上記のDNAメチル化酵素の遺伝子近傍のアノテーションから、DNAメチル化酵素遺伝子はファージ関連遺伝子に近接して見つかることが多いことが示された。この関係をより詳細に調べるために、Cenote-Taker 238とCheckV39を用いてアクセサリー領域をスキャンすることにより、各ゲノムのプロファージ候補領域を抽出したところ、1255のプロファージ候補領域が明らかになり、そのほとんどが完全なゲノムであると予測された(補足データ8-10)。これらのプロファージの大部分(n = 824)は少なくとも1つのDNAメチル化酵素遺伝子をコードしており、ゲノムセット中のDNAメチル化酵素遺伝子6011個のうち1089個を占めた。1255の推定プロファージは、411のウイルス操作分類単位(vOTU)に分類された(補足データ9)(Methods参照)。注目すべきは、個々のvOTUの中でメチル基転移酵素遺伝子の含有量にかなりの多様性があることと、異なるファージゲノム間で単一のメチル基転移酵素遺伝子ファミリーが広く分散していることである(図4と補足図8)。全体として、このことは、BFGファージゲノム間で実質的なメチル基転移酵素遺伝子の流れが存在することを示唆するだけでなく、異種のBFGファージゲノムが互いに遺伝的多様性の重要な供給源として機能する可能性を示唆している。
図4:ネットワーク解析により、異種ファージゲノム間の実質的なメチル基転移酵素遺伝子の流れが明らかになった。
ファージのウイルス操作分類単位(vOTU)クラスターとDNAメチル基転移酵素遺伝子ファミリー(80% AAI, 80% AF)のネットワークグラフ。形状の大きさは、与えられたvOTUクラスター内のファージゲノムの数、または遺伝子ファミリー内のメチル基転移酵素遺伝子の数に比例する。エッジはメチルトランスフェラーゼ遺伝子ファミリーと、そのメチルトランスフェラーゼ遺伝子ファミリーのメチルトランスフェラーゼ遺伝子をコードするプロファージゲノムを含むvOTUクラスターを結ぶ。エッジの太さは対応する遺伝子ファミリーをコードするゲノム数に比例する。
フルサイズ画像
BFGメチル化モチーフは、パネピゲノムが開いた広大なコンビナトリアル空間をタイル状に形成している
オックスフォード・ナノポア・シーケンス・テクノロジーは、最近開発された手法で6mA、4mC、5mC修飾を同定するために使用されている。Nanodiscoは、メチル化パターン検出のための強力なアプローチであり、メチル化されたネイティブゲノムDNAの生のナノポアシーケンストレースを、調製した非修飾DNAと比較することで機能する40。このデータセットでNanoporeとNanodiscoが行ったメチル化コールを別の手法と比較するベンチマークとして、PacBioとNanodiscoのメチル化モチーフ同定を、両手法のシーケンスデータが得られた6つの生物種を代表する6つの分離株のサブセットについて行った(Methods)。この比較により、6mAと4mCの結果が一致することが明らかになった。PacBio SMRTシーケンスでは、Nanodiscoによる29/33の6mAモチーフコールと2/2の4mCモチーフコールが同定されました。Nanodiscoによる2つの5mCコールはPacBioシーケンスでは同定されなかったが、これは5mCに対するPacBioアプローチの感度が低いことと一致している(補足表2)。
次に、Nanodisco法を5つの生物種にまたがるBFGコレクションから268ゲノムに適用し、メチル化モチーフを手作業でキュレーションした(Methodsと補足図9-10に記載)。合計639の異なるメチル化モチーフがde novo discoveryによって検出された(図5と補足データ11)。驚くべきことに、レアファクション曲線(図5a)とヒープの法則(補足表3)に基づく解析データセットでは、別個のメチル化モチーフの数は飽和にはほど遠く、BFGが使用するモチーフの総数は膨大であることが示唆された。このサンプルセットに見られる個々のメチル化モチーフの多様性に加えて、モチーフの組み合わせのほとんどは、単一の分離株だけに存在するユニークなものであり、コンビナトリアルな多様性をさらに生み出し、まだサンプル化されていないBFG内のモチーフの組み合わせの膨大な数を示唆していた(補足図11)。ほとんどのモチーフは単一菌種でのみ検出されたが、2つのモチーフ(CTGCAG、GATC)は、分析した5菌種すべての少なくとも1つの分離株で検出された。PacBioとバイサルファイトシーケンスの両方を用いたBifidobacterium breve分離株の研究41と、PacBio SMRTシーケンサーのみを用いたClostrioides difficileを調べた別の研究(方法を変更しないと5mCの感度が低い9)では、これらの分類群ではパネピゲノムの飽和度がより高いことが示された(図5aにプロットしたこれらの研究のデータ)。サンプリングセットの多様性が低かったり、モチーフの検出感度が低かったりすると、ゲノムカバレッジが低くても見かけ上の飽和が生じる可能性がある。それにもかかわらず、これらの結果は、BFG種が他の消化管嫌気性菌よりも多様なメチル化モチーフやモチーフの組み合わせを含んでいる可能性を示唆している。
図5: BFGのメチル化モチーフは、配列決定された分離株セットにわたって、パネピゲノムが開いている広大な組み合わせ空間をタイル状に形成している。
a 本研究でBFG種のゲノムから検出されたDNAメチル化モチーフのレアファクション曲線と、外部研究のC. difficileおよびB. breve種との比較('*'で示す;データ9,41)。b-fは、Parabacteroides distasonis、B. vulgatus、B. fragilis(sensu stricto)、B. ovatus、B. thetaiotaomicron分離株で検出されたDNAメチル化モチーフのヒートマップ。行は個々の分離株と対応するMLSTマーカー遺伝子の系統を示す。列は明確なメチル化モチーフを示す。各セットで最も一般的な3つのモチーフにラベルを付け、残りはラベルを省略している。あるモチーフが対応する単離株中に存在する場合、セルは色付けされ、色は凡例に示すように塩基修飾のクラスを示す。すべてのモチーフの配列はSupplementary Data 10にある。
フルサイズ画像
解析の各生物種(B. fragilis、B. thetaiotaomicron、B. ovatus、B. vulgatus、P. distasonis)について、それぞれのDNAメチル化モチーフの有無を、その生物種内のマーカー遺伝子の系統樹との関連で調べた(図5b-f)。上述したように、メチル化モチーフの大部分は、セット内の単一分離株のみに存在した。少数のDNAメチル化モチーフは、ある種のすべての分離株でメチル化されていた(例えば、B. fragilisのCTCATやP. distasonisのCGCG、CCAGG、CCTGG)。いくつかのモチーフは亜種の系統内でほとんど、あるいは完全にメチル化されていた(例:B. ovatusのGATC)が、他のモチーフは系統に関係なく分布しているようであった(例:B. thetaiotaomicronのCCWGG)。少なくとも1つのメチル化モチーフは、2つのB. thetaiotaomicron分離株と1つのB. vulgatus分離株を除くすべてのゲノムで検出された。
AMR遺伝子とプロモーターにはDNAメチル化モチーフが多く存在する
AMR遺伝子の転写制御は、多くの異なる生物種において耐性表現型の発現に重要な役割を果たすことが知られており、最近の研究では、AMR遺伝子の発現と耐性表現型がメチル化によって特異的に制御されることが実証されている10,42。そこで我々は、BFGのAMR遺伝子の遺伝子本体とプロモーターにおいて、転写に影響を及ぼす可能性のあるDNAメチル化モチーフを探索した。このようなモチーフの頻度と分布を調べるため、B. fragilis、B. thetaiotaomicron、B. ovatus、B. vulgatus、P. distasonisゲノムからAMR遺伝子とその上流領域(200塩基)を抽出し、塩基同一性99%で複製解除した(Methods参照)。これらのAMR遺伝子領域について、対応する種の少なくとも1つのゲノムで見つかったモチーフの有無をプロファイリングした(補足図12A-E)。驚くべきことに、プロファイリングされたAMR領域はすべて、遺伝子本体と上流/プロモーター領域に複数のDNAメチル化モチーフを持ち、少なくともいくつかの分離株で検出された。
AMR遺伝子本体におけるモチーフ密度が、ゲノムの残りの部分と異なるかどうかというさらなる疑問を投げかけるために、十分な数の分離株が存在する5つの主要生物種において、非AMR遺伝子に対するAMR遺伝子のメチル化解析を行った。この解析で、モチーフ含有量とGC含有量との間に直接的な相関関係が明らかになった。この相関関係のため、モチーフ密度をAMR遺伝子対非AMR遺伝子のGC含量の関数として解析した。この解析では、AMR遺伝子と非AMR遺伝子のモチーフ密度(GC含量で調整)の間に、集約的な系統的差は見られなかった(補足図13)。これらのAMR遺伝子または関連するプロモーター領域におけるメチル化が、抗菌薬耐性に影響を及ぼすかどうかについては、さらなる調査が必要である。
系統特異的DNAメチル化モチーフは枯渇の証拠を示す
DNAメチル化モチーフのサブセットは、系統学的に強いシグナルを示し、近縁のゲノムのほとんど、あるいは全てに存在するが、同じ種の遠縁のゲノムではほとんど見られないか、全く見られない。この濃縮は、このモチーフを持つゲノム位置が、最後の共通祖先以来、これらの系統でメチル化されてきたことを示していると解釈された。メチル化酵素が導入された後、ゲノムのいくつかの遺伝子座でこれらの修飾を許容することに関連した負のフィットネスコストがあるとすれば、選択によってメチル化酵素を含む系統のゲノムでこれらのモチーフが枯渇することが予想される。さらに、ある特定の文脈におけるメチル化は、修飾塩基の超変異と関連しており、その結果、モチーフの自己破壊がプログラムされている16。
我々は14の系統特異的モチーフを同定し(Methods参照)、これらの14のうち6つ(42.9%)は、多重検定補正後に系統ゲノムで有意に減少しているように見えたが、濃縮されたものはなかった(図6)。比較のために、並べ替えによって得られた同じ長さと塩基組成の16から58のコントロールモチーフ(例えば、GATCコントロールモチーフはAGTC、ATCG、CTAGを含む)のモチーフ密度を各系統特異的モチーフについて計算した。58以上の可能性のあるコントロールモチーフが存在する場合、ランダムシャッフリングによって50が選ばれた。並べ替えられたモチーフの0%から13.7%が枯渇し(平均3.8%)、0%から37.5%が濃縮された(平均5.1%)(図6、補足図14-21、補足表4)。注目すべきは、有意なレベルで枯渇したと思われる6つの系統特異的モチーフのうち、5つのモチーフは、これらのモチーフを持つ各遺伝子座が両方の鎖にメチル化された塩基を持つような形で回文化していたことである。枯渇した非回文モチーフ(TCAGG/CCTGA)はタイプIISモチーフで、モチーフが互いに逆相補であるため、これらの遺伝子座のDNAの両鎖もメチル化されている。両鎖でメチル化されたモチーフに対して選択が異なって作用するかどうかは、このデータセットでは明確に評価できないが、さらなる疑問である。5mCと4mCの修飾では、修飾部位のトランジションやトランスバージョンに起因すると思われるモチーフの濃縮は観察されず(補足図21)、ハイパーミューテーションだけでは所見を説明できないことが示唆された16,17。
図6:DNAメチル化モチーフは、系統特異的な文脈でゲノム全体にわたる枯渇を示す。
(上) ゲノム全体の各モチーフの密度(モチーフ/キロベース)のZスコアの群プロット。各標的モチーフとその対照モチーフについて両側T検定を行い、FDR < 1%でBenjamini-Hochberg検定を別々に行った。未調整のp値は以下のように報告されている: *p<=0.05、***p<=0.01、***p<=1e-3、***p<=1e-4; "ns "は、報告されたp値がFDR=1%でのBenjamini-Hochbergでの検定後に有意でないと決定されたことを示す。(中) 1キロ塩基あたりのモチーフ数。ボックスはデータの四分位数、ひげは1.5倍のIQRを示し、ひし形は外れ値を表す。(下)系統特異的DNAメチル化モチーフのヒートマップとともに、メチローム解析された全ゲノムを用いた種ごとのMLSTマーカー遺伝子クラドグラム。(全)B. fragilisゲノム、n = 108。B. ovatusゲノム、n = 44。B. vulgatusゲノム、n = 28。
フルサイズ画像
考察
本研究で実施したグローバルメチローム解析と連続したロングリード解析の組み合わせにより、臨床BFG分離株におけるエピジェネティックなランドスケープが、これまで認識されていなかった膨大な多様性を持つことが明らかになった。何百ものDNAメチル化モチーフが同定され、ほとんどのモチーフがユニークであった。いくつかの種(B. fragilisとP. distasonis)は、解析された各ゲノムで検出される種特異的モチーフを含んでいるように見えたが、これはまれなことであり、ほとんどすべてのモチーフの組み合わせは、単一の分離株でのみ観察された。さらに、DNAメチル化モチーフの構成は、1つの種のゲノム間の系統学的距離が短くても劇的に変化し、BFG内の近縁系統間でもエピジェネティックな多様性があることが示唆された。
DNAメチル化パターンの実質的な多様性は、バクテリアの生命ドメイン内の種間で観察されているが43、1つの属内の異なる種間のDNAメチル化多様性に関する大規模な調査はこれまで行われておらず、近縁種を系統的に比較したこともない。我々の研究は、BFGの臨床分離株のユニークな歴史的コレクションに基づいて、メチローム、種内および種間の系統樹、BFG内の多様性の間の関係の広範な分析を提唱するものである。本研究のベースとなった分離株コレクションには、我々のデータセットに大きな価値を付加する特徴がある。第一に、先行するBFG研究の多くがGIマイクロバイオームから収集された菌株に焦点を当てているのに対し、本研究では主に感染部位から培養されたBFG臨床分離株が含まれており、そのゲノムとメチロームにより、侵襲性分離株が常在GI株とどのように異なるかについての研究が促進される可能性がある。第二に、このセットは40年にわたり、一般的に使用されている多くの薬剤について、抗生物質が使用される以前から初期の時代まで遡ることができるため、レジストームとメチロームの両方が、40年間にわたるこれらの薬剤の選択下でどのように進化したかを調べることができる。
私たちの発見は、BFG菌種がヒトの消化管マイクロバイオームに生息する他の病原体や常在菌よりも多様なエピゲノムを持っているかどうかという疑問を投げかけるものである。入手可能なデータが限られていることから、この疑問に答えることは困難である。レアファクション解析の結果、私たちが研究したBFG種のパネピゲノムは、配列決定されたセットにわたって漸近的飽和の兆候を示すことなくオープンなままであり、サンプリングされていない実質的な多様性を示唆していることが示された。C.difficile9.やB.breve41の公開データの同様のレアファクション解析と比較すると、DNAメチル化モチーフの種内多様性はBFGよりもやや少ないことが示唆された。しかし、この解析にはいくつかの重要な注意点がある。第一に、B. breveとC. difficileの研究では宿主ゲノムの多様性が低く、メチル化モチーフの多様性が過小評価された可能性がある。第二に、本研究ではメチル化モチーフの検出により感度の高い方法を用いたため、見かけ上の多様性が大きくなった可能性がある。メチロームの多様性が系統や生活様式によって本当に影響を受けるのかどうかを明らかにするためには、他の生物種についてより徹底的な調査が必要である。
本研究ではメチル化が転写に及ぼす影響については調べなかったが、これまでの研究で、DNAメチル化によって転写が大きく制御されていることが示されている42。われわれが観察したエピゲノムの多様性は、個体群内で転写の多様性を比例的に生み出し、選択によってフィットネスに影響を与えるのではないかと推測するのは妥当かもしれない。個々の細菌系統において、ゲノム全体にわたってDNAメチル化モチーフが枯渇していることが明らかになったことは、BFGゲノムの進化に示唆を与える。これらのケースでは、メチル化ヌクレオチドの変異によって枯渇を説明するのに十分な大きさのモチーフが増加することはなかった。一方、メチル化されたモチーフを除去しようとする選択が作用し、その結果フィットネスが低下するのであれば、メチル化されたヌクレオチドに限定される必要はない。根本的なメカニズムを理解するためには、さらなる調査が必要である。
今回のデータセットでは、メチル化モチーフがAMR遺伝子の転写に影響を及ぼし、AMR表現型の発現に影響を与えたり、発現を制御したりする可能性があるかどうかという具体的な疑問について検討した。その結果、カルバペネム耐性を媒介するβ-ラクタマーゼをコードする重要なcfiA遺伝子を含め、調べたAMR遺伝子のすべてのクラスに、上流の遺伝子間領域と遺伝子本体の両方にメチル化モチーフが含まれていることがわかった。さらに、分離株間におけるモチーフの全体的なエピゲノムの多様性は、AMR遺伝子本体に隣接するメチル化モチーフや遺伝子本体内のメチル化モチーフの多様性にも反映されていた。我々が調べたAMR遺伝子の全クラスに関与する広範な潜在的メチル化の知見を考慮すると、これらの遺伝子の転写とその結果生じる耐性表現型は、どのメチル化酵素が存在するか、またその発現に影響されると予想するのが妥当であろう。エピゲノムの多様性に起因するAMR表現型の不均一性は、BFG集団に利益をもたらす可能性があり、抗生物質への曝露によってしばしば生じる純化選択によって、特定のエピゲノムメチル化パターンが他のパターンよりも選択される可能性がある。
ゲノム解析のみに基づいてDNAメチル化モチーフと同族DNAメチル化酵素を結びつけることは困難である。細菌ゲノム、特に移動性遺伝要素内に存在する遺伝子によってコードされるDNAメチル化酵素の多くは、ほとんどの条件下では機能的に不活性である。DNAメチル化酵素の不活性化変異や、メチル化酵素の発現を制御するインバーティブル・プロモーターのような他の遺伝子スイッチは、転写プログラムを変化させるために使われる共通の進化的メカニズムである可能性が示唆されている44。実際、我々のセットのほぼすべてのゲノムで、検出されたメチル化DNAモチーフよりも、潜在的なDNAメチル化酵素遺伝子の数の方が多かった。このことは、BFG内にサイレントなメチル化酵素が広く存在するか、あるいは、豊富な培地上での標準的な増殖条件下では発現しないメチル化酵素が存在することを示唆している。このことは、進化的・機能的に興味深い意味を持つかもしれないが、特定のメチル基転移酵素を特定のモチーフに関連付けるという技術的な課題をもたらす。我々のデータセットがさらに複雑なのは、ほとんどのモチーフが1つまたは数個のゲノムでしか検出されなかったという事実である。さらに、ここで適用したNanodisco法の感度は100%未満であるため、検出されなかったメチル化モチーフもあると予想される40。
我々のゲノムデータセットから発見された6000以上の潜在的メチル化酵素遺伝子のうち、大部分は殻や雲のコンパートメントに位置し、しばしば移動性遺伝要素に関連していた。これらの発見は、他の研究結果35,36と一致しており、またメチラーゼの多くが制限修飾や他の防御システムの構成要素であるという仮定とも一致している。重要なことは、同定されたメチル化酵素遺伝子の約1000個が、無傷のプロファージと関連していたことである。これらのプロファージゲノムをネットワーク解析した結果、異種ファージ間でメチル基転移酵素遺伝子の流れが著しく、異なるクラスを含むメチル基転移酵素がファージゲノム間でモジュール的に交換されていることが明らかになった。これらの知見は、BFGエピゲノムの多様性を推進する究極の源の一つとして、BFGファージ間の遺伝子交換が基本的な役割を担っていることを示唆している。今後、ファージ-ファージ間の相互作用が自然のGIマイクロバイオームにおいてどのような関係にあるのか、また、これらの相互作用がBFGメチロームの多様化をどのように促進したのかを調べる必要がある。
研究方法
分離株の保存、増殖、同定
1973年から2018年の間に臨床材料から培養された過去のBFG分離株は、凍結乾燥またはスキムミルク培地中で凍結保存され、国立衛生研究所臨床センターDepartment of Laboratory Medicine(メリーランド州ベセスダ)に保管された。分離株は非同定化され、培養年、培養元/培養地を含むメタデータが維持された。このように識別を解除したため、コレクション中の分離株の中には、1人の患者から複数回採取された可能性のあるものを除外することはできなかった。より大規模なセットから配列決定のために選択された分離株のサブセットは、日付、感染源、菌種、およびAMRプロファイルの多様性を最大化するように選択され、この選択により、1人の患者からサンプリングされた分離株が含まれる可能性が低くなった。分離株のサブセットには、培養日および/または培養源に関する正確な情報がないことに留意すべきである。選択された分離株は、製造元のデータベースを用いてBruker Biotyper MALDI-TOF質量分析法を用いて同一性を確認するために、過去のオリジナルストックから回収され継代された(補足データ2)。すべての分離株は、BD BBLTM CDC Anaerobe 5% Sheep Blood Agar(BD 221734, Becton, Dickinson and Company, Sparks, MD)、またはヘミンとビタミンK1を添加した5%羊血を添加したBD BBLTM Brucella Agar(BD 297716)で回収した。培養は通常、BD BBLTM GasPak CO2ジェネレーター(BD 261205)を備えた三菱アネロ嫌気ガス・チャンバー内で、35~37℃、6%CO2条件下で36~72時間行った。分離株は好気的条件下で操作された。BFGが確認された分離株はその後再分離され、その後の培養と実験のためにCryosavers Skim Milk Media Cryovials(Hardy Diagnostics, Santa Maria, CA)に-80℃で保存された。
寒天希釈による嫌気性感受性試験
感受性試験は、Clinical and Laboratory Standards Institute(CLSI)のガイドライン(第9版、M11)またはWadsworth-KTL Anaerobic Bacteriology Manual(第6版)に記載されている基準寒天希釈法を用いて実施した。簡単に説明すると、すべての感受性試験培地は、100mm角の格子状シャーレに30mL満たし、1週間以内に使用する。接種用培地の調製には、冷凍ストックから回収した分離コロニーを5%羊血、ヘミン、ビタミンK1(BD 297716)を添加したブルセラ寒天培地に再分離し、40~48時間培養して2回継代培養した。選択された増殖菌は、DEN-1B Densitometer (Grant Instruments, Cambridge, UK)またはMicroscan Turbidity Meter (Dade Behring (現Siemens) Munich, Germany)で測定した0.5マクファーランド濃度のBrucella Broth (B3051, Sigma-Aldrich, St-Louis, MO)に懸濁した。
各試験分離株2マイクロリットル(105 cfu/スポット)を、ヘミン、ビタミンK1(B2926、Sigma-Aldrich)、および選択した抗生物質と濃度を含む5%Laked Sheep's Blood(Hemostat、Dixon、CA)を添加した新鮮なBrucella寒天培地に塗布した。試験した抗生物質の濃度は、CLSIが臨床的ブレイクポイントとして定めた濃度と一致していた。すべてのプレートに以下の品質管理用細菌を接種した: 大腸菌25922、B. thetaiotaomicron(ATCC 29741)およびB. fragilis(ATCC 25285)。解釈基準はCLSIの嫌気性菌ブレイクポイントに基づき、以下のように設定した(抗生物質の後にS:I:RのMICをμg/mlで表示): Moxifloxacin 2:4:8; Ampicillin 0.5:1:2; Ampicillin/Sulbactam: 8/4:16/8:32/16;クリンダマイシン:2:4:8;メトロニダゾール: 8:16:32; メロペネム 4:8:16;ピペラシリン/タゾバクタム: 32/4:64/4:128/4;テトラサイクリン:4:8:16。感受性判定は約48時間の増殖後に行った。
DNA抽出と配列決定
1つの分離株から得られた複数のBFGコロニーをPBSまたは滅菌水に懸濁して抽出した。イルミナシーケンス用の抽出は、DNeasy Blood & Tissue(Qiagen, Frederick, MD)およびNucliSENS easyMag(bioMerieux, Durham, NC)を用いて行った。ロングリードシーケンス用の高分子量DNAは、グラム陰性プロトコルを用いたGentra Puregene Yeast and Bacteria kit(Qiagen)、またはカスタマイズしたMaxwell HT gDNA Blood kit(Promega Corporation, Madison, WI)プロトコルを用いたKingfisher Flexシステム(ThermoFisher, North Logan, UT)で、PBS懸濁液中の10μl接種ループの1/5に相当する量の菌体からDNAを抽出し、120μlの最終溶出量を用いて抽出した。DNA濃度はQubit 4蛍光光度計(ThermoFisher)を用いて測定し、純度はNanodrop One(ThermoFisher)を用いて一部のサンプルについて評価した。
イルミナシーケンス用のDNAは、RipTide High Throughput Rapid Library Prep Kit(IGenomX, Carlsbad, CA)を用いて調製した。ライブラリーは、NIH Intramural Sequencing Centre(NISC)ではIllumina HiSeq 2500(Illumina、カリフォルニア州サンディエゴ)、NIH Clinical CenterではIllumina NextSeq 550装置で150 bp PEリードを生成するためにシーケンスした。シーケンスデータはiGenomXプロトコル(http://fulcrumgenomics.github.io/fgbio/)に従ってfgbio v 0.7.0でデマルチプレックスし、異なるレーンからのデマルチプレックスリードをマージした。多くの Igenomix RipTide ライブラリーで品質管理上の問題が発生し、その結果、あるシーケンスランのライブラリー間でバーコードとバーコードが著しく混在したリードファイルがデマルチプレックスされた。厳密な品質管理パラメータを使用して、これらのライブラリーのサブセットを選択し、その後のステップでロングリードアセンブリのポリッシュを行った(ゲノムアセンブリを参照)。
Oxford Nanopore Technologies (ONT)のゲノムシーケンスでは、ONT Rapid Barcoding Sequencing Kit (SQK-RBK004)とONT R9.4.1フローセル(ONT, Oxford, UK)用のプロトコルを用いて、抽出したDNAからゲノムライブラリーを調製した。シーケンシングはONT GridION X5装置で行った。DNAメチル化モチーフ同定のために、Oxford Nanopore Rapid PCR Barcoding Kit(SQK-RPB004)とプロトコル(RPB_9059_v1_revL_14Aug2019)を用いてペアメチル化フリーライブラリーを調製し、ONT GridION Mk1装置を用いてONT R9.4.1フローセルでシーケンスした。SQK-RPB004プロトコルは、7.5 ngの入力ゲノムDNAを使用するように変更され、PCRステップは7分30秒の伸長ステップを使用するように変更された。
PacBioゲノムシーケンスには、Pacific Biosciences社のプロトコール "Preparing multiplexed microbial SMRTbell libraries for the PacBio Sequel System "を用い、3μgのDNAからライブラリーを作成した。Sequel sequencer(Pacific Biosciences社製)を用いて、バージョン3のSMRT細胞とシーケンス試薬を用い、10時間ムービーでシーケンスを行った。
ゲノムアセンブリ
バイオインフォマティクス解析は、主にNIH HPC Cluster Biowulf上で、インストールされたモジュールとConda v.4.8.3の管理環境を用いて行った。詳細なスクリプトと手順はZenodo (https://zenodo.org/record/7510225)で提供されている。イルミナリードはCutadapt v.2.645でトリミングし、SPAdes v.3.13.146でアセンブルした。500bp以下のコンティグを除去した後、CheckM v 1.0.1847でアセンブリーのゲノム完全性とコンタミネーションをチェックした。完全性が98%以上、コンタミネーションが2%未満のアセンブリーからの生リードは、Pilon v 1.2348を用いたONTロングリードアセンブリーのポリッシングに使用した。
ONTベースコールは、スタンドアロンのGuppy v.3.3および3.4.5を用い、qcat v.1.0.6によるデマルチプレックスを行った。ONT GridION MK1装置もMinKnow 19.12.6(Guppy v.3.2.10+aabd4ec、Guppy v.3.4.5と同等)を用いてベースコールとデマルチプレックスに使用した。フィルタリング、アセンブリー、ポリッシングはSnakemake v 5.13.049で管理した。ONTリードはFiltlong v. 0.2.0 (https://github.com/rrwick/Filtlong)を用い、-min_length 1000 --keep_percent 95の設定で品質管理した。フィルターしたリードはFlye v.2.750でアセンブルに使用し、ほとんどのアセンブルで-metaフラグを有効にしたが、多数のスプリアスコンチグが生成されたアセンブルのサブセットを最適化するために無効にした。Flyeの-asm-coverageフラグも100に設定し、ONTシーケンスリードのダウンサンプリングの必要性を回避し、その後のポリッシングのために可能な限りカバレッジを保持しました。反復Racon v. 1.14.351ポリッシングを4回行った後、Medaka v. 0.12.1(https://github.com/nanoporetech/medaka)を最終エラー修正ステップに使用し、短いリードが利用可能な場合はPilonを使用した。Circlator v.1.5.5の "fixstart "オプションをアセンブリーで使用し、染色体をdnaAスタートに方向転換するか、コンティグを予測される遺伝子の中央付近に方向転換した。メダカを磨いたアセンブリーを再度CheckMで完全性を評価し、完全性が90%以上でコンタミネーションが3%以下のアセンブリーを以降の解析に残した。rRNAオペロンはBarrnap v0.9(https://github.com/tseemann/barrnap)を用いて定量した。
PacBioゲノムを構築するために、脱多重化したPacBio Sequelサブスレッドを、PacBio SMRT Linkバージョン6.0.0パッケージ内のHierarchical Genome Assembly Process(HGAP4)パイプライン、またはCanu(バージョン1.6または1.8)を用いてアセンブルした52。アセンブルされたコンティグは、Circlator 1.5.353を使用してサーキュラライズされ、HGAP4またはCanuから生成されたリードを補正した。場合によっては、ドラフトコンティグをGepard v1.3054を用いてコンティグのオーバーラップを評価し、手作業で配列を結合して環状化した。環状化された染色体およびプラスミド配列は、PacBio SMRTLink version 6.0.0 resequencing pipelineでポリッシュされた。FASTAアセンブリはProkka(バージョン1.13)パイプラインを用いてアノテーションした55。
系統解析および抗菌薬耐性遺伝子の同定
多座配列解析(MLSA)は、本研究のロングリードアセンブリとNCBI56のリファレンスを用いて行った。MLSAで全遺伝子を検索しやすくするため、ONTで作成したアセンブリーではフレームシフト補正が必要であった。MEGAN v.6.19.257をDIAMOND v 0.9.3358上で使用し、Bruker Biotyperで決定された同一生物種のタンパク質配列の参照ファイルに対するONTアセンブリーのアラインメントを行い、前述のようにフレームシフト補正されたfastaファイルを出力した59。すべてのアセンブリーおよびリファレンスは、Zenodo (https://zenodo.org/record/7510225)から入手可能なカスタムBacteroidesタンパク質データベースを用いて、Prokka v.1.4.655でアノテーションした。BLAST v2.10.0+で参照MLSAスキーム遺伝子クエリ60と一致した遺伝子座タグ。Prokkaから出力されたfasta nucleotide/proteinファイルに対するBLASTn61およびBLASTxを遺伝子検索のために同定した。フレームシフトにより切断されたままのアノテーションは、Prokkaで同定されたスプリットアノテーションと遺伝子間領域を手動で取得することで解決した。遺伝子座タグで遺伝子を検索し、MEGA X v.10.1.8でMUSCLE62を用い、デフォルトパラメータでアライメントするために連結した(16S-dnaJ-gyrB-hsp60-recA-rpoB)。占有率75%未満のカラムはtrimAL v.1.4.rev1563を用いて削除した。RaxML v. 8.2.1264を用い、GTRGAMMAモデルで20のツリーサーチャーを用いて系統樹を作成し、500ブートストラップでテストした。根付かない木をggtree65で可視化した。
スケッチサイズ10,000のMash v.2.366を、フレームシフト補正なしで、アセンブリーを用いた全ゲノムの全対全比較に使用した。1-Mash距離は平均ヌクレオチド同一性(ANI)推定値として使用し、NCBIから検索した追加参照アセンブリーを比較に含めた。ヒートマップは、R 4.2.1とComplexHeatmap v 2.14.067を用い、ward D2法を用いて計算したhclust距離にdendsortを適用して作成した。Bacteroides68,69,70,71 (https://github.com/thsyd/bfassembly)に対して、最小カバレッジ80%、最小同一性80%のAbricate (https://github.com/tseemann/abricate)を用いてAMR遺伝子を検索し、1911個のAMR遺伝子が見つかった。abricateの出力表はSupplementary Data 12にある。
GTDB-Tk v2.0.0はr207参照データベースをデフォルト設定で使用し、セット内の全ゲノムを分類した30。Bacteroides vulgatus(旧名称)とPhocaeicola vulgatus(新名称)の同等性を仮定し、GTDB-TkとMALDIによる種の同定(360/383ゲノムの一致、94.0%)を行った。分離株とGenBank Referencesの要約メタデータはSupplementary Data 2にある。
パンゲノムおよびアクセサリー領域の特性解析
Nanoporeシーケンスに伴うアセンブリーエラーを補正するために、Proovframe v0.9.7(およびdiamond v2.0.8)(https://github.com/thackl/proovframe)を使用した。研磨したBFGゲノムをGenbank nrデータベース(リリース245)にアライメントし、ORFの連続性を改善するためにインデルの領域をNsに置き換えることでインデルを補正した(Zenodoからhttps://zenodo.org/record/7510225 として入手可能)。このインデルの修正ステップを行わないと、ORFの分割によってORF数が人為的に増加し、遺伝子ファミリー単位の計算に影響が出る可能性がある。Proovframeで補正されたゲノムはProkkaでアノテーションされた。図1および関連する補足図に関連するもの以外のすべてのゲノムベースの解析は、Proovframe補正ゲノムを用いて行った。
PPanGGOLiN v.1.1.13631はパンゲノムのグラフと統計の作成に使用した。ゲノムを生物種ごとにグループ化し(MALDI法)、同じ生物種のゲノムをデフォルト設定でPPanGGOLiNの入力として使用した。これらの設定を用いて、平均アミノ酸同一性80%およびアラインメント率80%の閾値内で遺伝子をファミリーにグループ化した。各パンゲノムについてレアファクション曲線を作成するために、PPanGGOLiN遺伝子ファミリーマトリックス表をMicroPan72レアファクションモジュールに50通りの順列で、MicroPan Heapsモジュールに100通りの順列で入力した。
各生物種のPPanGGOLiN pangenome graphファイルをPPanGGOLin rgp33の入力として、デフォルト設定(最小3000塩基長)で使用し、アクセサリー領域(「ゲノム可塑性の領域」)を見つけ、これらの領域をfastaファイルとして出力した(補足データ3)。アクセサリ領域の配列は、BLASTNで" -perc_identity 90 "のフラグをつけて "all-vs-all "でアライメントした。CheckVパッケージのAnicalcを用いて各アラインメントのANIとAF (Alignment Fraction)を計算し、各アクセサリー領域配列についてANI > = 95、AF > = 85のアラインメント数をカウントした。アクセサリー領域配列は、多くの場合、タンデムにある複数の移動性遺伝要素またはゲノムアイランドから構成されることがあり、バクテリオファージを除いて、これらの領域内の個々の要素を分離する試みは行われなかったことに注意されたい。
アクセサリー領域のファージ防御系を見つけるために、Padloc v1.0.1とデータベースv1.1.0をデフォルト設定で使用した73。AMR遺伝子は上記のようにAbricateを用いて同定した。DNAメチルトランスフェラーゼ遺伝子は、後述のDNA Methylase Finderを用いて同定した。バクテリオファージは、Cenote-Taker 2 v2.1.3 (https://github.com/mtisza1/Cenote-Taker2)を用い、フラグ"-p false -db virion --lin_minimum_hallmark_genes 2 --circ_minimum_hallmark_genes 2 "で同定した。その後、CheckV v0.7.0とデータベースv0.6を用いて、プロファージの境界を見つけ、各ファージ配列の完全性を推定した。結合機構遺伝子を見つけるために、各アクセサリー領域配列のORFを見つけ、フラグ"-p meta "を使ってprodigalで翻訳し、フラグ"-E 1e-8 "を使ってhmmer74を使い、PFAMから取り出した結合機構モデルのカスタムHMMデータベース(補足データ13)に対して全アミノ酸配列をクエリーした。与えられたアクセサリー領域配列でポジティブ同定を行うには、2つ以上の遺伝子に対するヒットが必要であった。
円形プラスミド/エピソームを見つけ、特徴付けるために、Flyeアセンブリ情報テーブルを解析し、サイズが1.5メガベース未満の推定円形配列を抽出した。このデータセットでは、いくつかの短いプラスミド/エピソームが高いコピー数(染色体あたり50コピー以上)で存在し、場合によっては、これらの高いコピー数のプラスミド/エピソームは、同じフローセルで配列決定されたコンパニオンライブラリーでは低いコピー数で表現されていた。これはライブラリーのクロスコンタミネーションの可能性が高いと評価し、誤ったライブラリーにプラスミド/エピソームがアーティファクト的に割り当てられる可能性を減らすため、細菌染色体のカバレッジ値の80%以下のカバレッジ、またはカバレッジが配列全体の平均で30倍以下の円形コンティグを除外した。この結果、プラスミド/エピソームの真の数が過小評価された可能性がある。さらに、Flyeアセンブラーは、2つ以上のタンデムコピーのコンカテマーとして配列をアセンブルすることがある。各環状配列はBLASTNでアラインメントされ、アラインメントの全長が配列の全長の140%を超える場合は、エピソームを1単位の長さに切り詰め、人工的なタンデム重複の可能性を排除した。フィルターされた配列がプラスミド関連遺伝子を持つかどうかを決定するために、各配列をMOBsuite75に通し、続いてCDDデータベース76に対して" -evalue 1e-2 -seg yes "のフラグでRPS-BLASTを実行した。その後、プラスミドレプリカーゼ、リラクサーゼ、コンジュゲーションマシーナリー、インテグラーゼ、トランスポーズに関連するモデルのリストと照合した(補足データ14)。また、Abricateを各配列に対して上記のように実行した。プラスミド/エピソームは、CheckVのanicalcとaniclustを用いて、フラグ"--min_ani 95 --min_tcov 85"(最小ANI = 95%、最小AF = 85%)でおおよその操作分類単位(OTU)にクラスタリングされた。ネットワークグラフはCytoscape77で可視化した。
DNAメチラーゼファインダーの構築
DNAメチルトランスフェラーゼ遺伝子の同定は、少なくとも3つの理由から困難である:(1)DNAメチルトランスフェラーゼ遺伝子/ドメインの配列空間は非常に大きく多様である、(2)いくつかのDNAメチルトランスフェラーゼドメインは、他のドメイン、主にRNAメチルトランスフェラーゼドメインと相同性を持つ、(3)多くのDNAメチルトランスフェラーゼ遺伝子は複数のドメインを持つ(例.(3)多くのDNAメチルトランスフェラーゼ遺伝子は、複数のドメイン(例えば、DNAメチルトランスフェラーゼドメインとDNAヘリカーゼ)を持っているため、標準的なアノテーションツールでは、比較遺伝子のみ(メチルトランスフェラーゼ遺伝子ではない)でアノテーションされる可能性がある。さらに、ProkkaやNCBIのProkaryotic Genome Annotation Pipeline (https://github.com/ncbi/pgap)でアノテーションされた遺伝子の多くが "methylase "と表示されており、これらの遺伝子がDNAメチル基転移酵素なのか、RNAメチル基転移酵素なのか、タンパク質メチル基転移酵素なのか、あるいはそれ以外のものなのかが不明である。
これらの問題を解決するために、DNA Methylase Finderが作られました。パイプラインの全コンポーネントの完全な説明とドキュメント、およびこの研究で使用した完全な実行可能バージョンは、https://github.com/mtisza1/DNA_methylase_finder。パイプラインの最初に、入力タンパク質配列(または翻訳されたヌクレオチド入力)が、PFAM、CDD、PDB、Oliveira et al 2014の研究、および社内で生成された追加モデル(https://zenodo.org/record/6647341/)37から多様なDNAメチルトランスフェラーゼドメインのHMMのカスタムデータベースに対して、hmmerを使用してクエリされます。アライメントされたタンパク質は、DNAメチルトランスフェラーゼドメインと推定されるアライメントされた領域だけにトリミングされ、これらの領域は、hmmerを使用してCDDのすべてと照合され、他のモデル(RNAメチルトランスフェラーゼドメインなど)がよりよくマッチするかどうかが確認される。DNAメチルトランスフェラーゼモデルが最良のヒットとして残った場合、Oliveira et al, 2014のサブタイプ特異的モデルを用いて、推定DNAメチルトランスフェラーゼをタイプ分け(すなわち、タイプI、タイプII、タイプIIG、タイプIII)し、モチーフ特異性が既知のREBASEデータベースDNAメチラーゼ(http://rebase.neb.com/rebase/rebase.html)とのBLASTPアライメントによってモチーフ特異性を推定する(特異性を報告するためのデフォルトの閾値は80% AAIおよび80% AF)。最後に、ヌクレオチドコンティグ/ゲノムを入力として使用した場合、DNAメチラーゼ「遺伝子近傍」(±5遺伝子を挟む)のマップは、制限酵素、特異性サブユニット遺伝子、CDDの全てに対するモデルでアノテーションされる。このツールとドキュメントはGitHub (https://github.com/mtisza1/DNA_methylase_finder)で公開されている。データベースはhttps://zenodo.org/record/6647341/。
DNA Methylase Finderの感度を評価するために、DNAメチル化酵素のREBASE「ゴールドスタンダード」データベースを使用した(2021年5月21日ダウンロード)。これらのタンパク質配列は、デフォルト設定でDNA Methylase Finderの入力として入力された。逆に、偽陽性率を評価するために、BFGゲノムから推定DNAメチル化酵素遺伝子配列の全て(6011)を抽出し、1e-3評価閾値でBLASTPを介して、DNAメチル化酵素のREBASE "gold standard "データベースと比較した。
感度テストでは、DNA Methylase Finderはセット中の微生物のメチル基転移酵素を100%同定した。DNA Methylase Finderで同定できなかったREBASEデータベース中の推定メチル基転移酵素タンパク質は、マウスとヒトのメチル基転移酵素遺伝子、および誤ってデータベースに追加された可能性のある2つの硫酸転移酵素遺伝子(例えば、M.SenCer87DndC)だけであった。
偽陽性率の評価では、329/6011 (5.4%)の推定メチル基転移酵素遺伝子が、このe-valueカットオフ値ではREBASEデータベースにヒットしなかった。320のモチーフの中には、手動のHHpred検索に基づくと明らかに質の高いDNAメチル化酵素ドメインを持つものもあったが、他のモチーフは真の偽陽性と思われた。従って、この比較に基づく偽陽性率は最大5.4%と推定される。
ファージコードDNAメチル化酵素
プロファージ配列は上記のように抽出され、ウイルスOTUはCheckVのanicalcとaniclustを"--min_ani 95 --min_tcov 85"(最小ANI = 95%、最小AF = 85%)のフラグでクラスタリングすることにより生成された。ゲノムマップはCenote-Taker 2で作成し、関連ゲノムはClinker v0.0.2178で可視化した。DNAメチラーゼ遺伝子はDNA Methylase Finderで同定し、80%の平均アミノ酸同一性と "all-vs-all "BLASTP検索から得られたアラインメントとの80%のアラインメント率に基づいてaniclustでクラスタリングした。
ナノディスコによるメチル化DNAモチーフの同定
5種(B. fragilis、B. ovatus、B. vulgatus、B. thetaiotaomicron、P. distasonis)のBFG分離株268株のゲノムDNAを、上述のようにOxford Nanopore SQK-RPB004キットを用いて調製した。これらのデータと、単離株とマッチした「ネイティブ」(SQK-RBK004)ゲノムDNAシーケンスからのデータを、Guppy 5.0.7の「hac/high-accuracy」モードで(再)塩基コールした。Nanodisco v1.0.340を使用し、各ゲノムについて300チャンクを解析した(Nanodisco差分オプション)。Nanodiscoでのデータ処理後、すべてのゲノムは手作業によるモチーフキュレーションを受けた。初期出力として与えられる潜在的モチーフのかなりの割合が不正確である可能性が高いからである(通常、特異的すぎるか広すぎる)。専門家によるキュレーションは一人のオペレーター(MT)によって行われ、プログラムの出力の詳細な分析に基づいていた。エキスパートキュレーションでは、2つの一般的なエラーを特定し修正した。ひとつは類似モチーフのマージ、もうひとつはモチーフの切り捨てである。これら2つのエラーがどのように特定され、修正されたかのステップの完全な説明は、補足図8-9の例で示されている。
最終的にカタログ化されたモチーフは、(「Refine_motifs」プロットの検査によると)ほぼすべてのモチーフ出現で明らかなシグナル差を示す必要があった。手動キュレーションに適用した方法は保守的なアプローチであり、Nanodiscoで検出されなかった実際のメチル化モチーフが除外された可能性がある。I型DNAメチル化酵素は、ギャップモチーフとその逆相補体(例えば、TCANNNNNGTC/GACNNNNNTGA)を標的とすることに注意。解析の目的で、同じDNAメチル化酵素が標的とすると考えられる非パリンドロームモチーフを別々のモチーフとして数えることにした。解析に使用した外部データと同じカウントロジックを適用した9,41。
PacbioとNanopore/Nanodiscoのde novoモチーフ検出の比較
Pacbio、Nanopore native、およびNanopore PCRのゲノムシーケンシングデータを持つ分離株について、de novoモチーフコールをデフォルトのPacbioパイプラインとNanodiscoの両方で実行した。出力表を比較した(補足表2)。
BFGゲノムにおけるモチーフの定量化
各モチーフについて、NやWのようなあいまいな塩基を許容するフラグを持つseqkit locate79を使用して、関連するすべてのゲノム上の各モチーフのすべてのインスタンスをスキャンした。系統のイングループとアウトグループ間のモチーフ存在量の比較は、pythonでstats annotator v0.4.3パッケージ(https://github.com/trevismd/statannotations)を用いて、Benjamini-Hochberg補正(1�R)を用いたT検定で行った。
同様に、遺伝子におけるモチーフ密度を評価するために(補足図13)、prokka-output遺伝子配列を上記と同様にseqkitで評価した。seqkitは遺伝子の長さとGC%の確認にも使用された。AMR遺伝子を同定しアノテーションするために、Abricateを全遺伝子に対して実行した(上述)。
統計および再現性
本研究では、入手可能な保存臨床分離株のレトロスペクティブシークエンシングを行ったため、サンプルサイズを事前に決定するための統計的手法は用いなかった。コンタミネーションの証拠または品質不良のいずれかを示すシーケンスライブラリーは廃棄され、繰り返された。この研究では、非同定細菌分離株の配列決定、メチローム決定、バイオインフォマティクス解析のみが行われた。研究者はいずれの解析においても盲検化されていなかった。非同定BFG分離株は、凍結保存された歴史的コレクションから得られたため、このコレクションに関する事前登録基準はなかった。
倫理声明
本原稿で発表された研究は、非同定臨床細菌分離株のみを対象とした。そのため、この研究はOHSRP免除19-NIAID-00802に基づき、NIH IRBの審査から除外された。
報告概要
研究デザインの詳細については、本論文にリンクされているNature Portfolio Reporting Summaryを参照されたい。
データの利用可能性
本研究で得られたシーケンス生データは、BioProject accession code PRJNA646575としてNCBIデータベースに寄託されている。補足データファイル3、およびPacBioとナノポアゲノム構築とナノディスコ解析の生データと説明書は、zenodoデータベース(https://zenodo.org/record/7510225 and https://zenodo.org/record/7548812)にある。ナノポアシーケンスからの一次FAST5出力ファイルは、リクエストに応じて入手可能であり、ファイルサイズ(10 Tb以上)のため公開リポジトリにはアップロードされていない。この研究に関連する資料の請求には、NIHおよび米国政府との標準的なNIH Material Transfer Agreementが必要です。資料請求はJohn Dekker(john.dekker@nih.gov)まで。
コードの利用可能性
Methylase Gene FinderはGitHub https://github.com/mtisza1/DNA_methylase_finder、Linuxコマンドラインで利用可能。関連データベースはhttps://zenodo.org/record/6647341/。その他のスクリプトはhttps://zenodo.org/record/7510225。
参考文献
Hotchkiss、R. D. ペーパークロマトグラフィーによるプリン、ピリミジン、ヌクレオシドの定量的分離。J. Biol. Chem. 175, 315-332 (1948).
論文 CAS PubMed Google Scholar
大腸菌のdam株とdcm株についての総説。Gene 143, 1-12 (1994).
論文 CAS PubMed Google Scholar
動物DNAウイルスにおけるシトシンメチル化の存在と役割. このような研究は、日本だけでなく世界的にも注目されている。
論文 CAS PubMed PubMed Central Google Scholar
ヒトゲノムにおけるプロモーターDNAメチル化の分布、サイレンシングの可能性、進化的影響. Nat. Genet 39, 457-466 (2007).
論文 CAS PubMed Google Scholar
DNAメチル化の機能:アイランド、開始点、遺伝子本体、そしてそれ以上。Nat. 遺伝子のメチル化機構を明らかにした。
論文 CAS PubMed Google Scholar
DNAのメチル化機構を解明する。Nat. Rev. Genet 20, 157-172 (2019).
論文 CAS PubMed PubMed Central Google Scholar
Oliveira, P. H. & Fang, G. Conserved DNA Methyltransferases: a window into fundamental mechanisms of epigenetic regulation in bacteria. Trends Microbiol 29, 28-40 (2021).
論文 CAS PubMed Google Scholar
バクテリオファージ耐性機構(Labrie, S. J., Samson, J. E. & Moineau, S. Nat. 微生物学(Rev. Microbiol. 8, 317-327 (2010).
論文 CAS PubMed Google Scholar
オリベイラ、P.H.ら:Clostridioides difficileのエピゲノム解析から、胞子形成と病原性を媒介する保存されたDNAメチル化酵素を発見。Nat. Microbiol. 5, 166-180 (2020).
論文 CAS PubMed Google Scholar
ビブリオコレラエにおけるシトシンDNAメチル化の欠損は、高いシャペロニン発現とアミノグリコシドに対する耐性をもたらす。PLoS Genet 17, e1009748 (2021).
論文 CAS PubMed PubMed Central Google Scholar
ビブリオコレラエ(Vibrio cholerae)腸内細菌(Vibrio cholerae)は、細菌に感染した後、細胞内細菌に感染した後、細胞内細菌に感染した後、細胞内細菌に感染した後、細胞内細菌に感染した後、細胞内細菌に感染した後、細胞内細菌に感染した。Blyn, L. Blyn, Braaten, B. A. & Low, D. A. Pap pilin phase variation by the mechanism involving differential dam methyl states.
論文 CAS PubMed PubMed Central Google Scholar
N4-シトシンDNAメチル化はヘリコバクター・ピロリ菌の転写と病原性を制御する。Nucleic Acids Res. 46, 3429-3445 (2018).
論文 CAS PubMed PubMed Central Google Scholar
ヘリコバクター・ピロリ(Helicobacter pylori)における転写制御機構を解明した。Annu. Rev. Microbiol. 74, 655-671 (2020).
論文 CAS PubMed Google Scholar
大腸菌におけるメチル誘導ミスマッチ修復システムの進化。DNA Repair (Amst.) 38, 32-41 (2016).
論文 CAS PubMed Google Scholar
肺炎球菌の薬剤耐性PMEN1系統の遺伝的安定化には、その特徴的なdpniii制限修飾系が関与している。
論文 CAS PubMed PubMed Central Google Scholar
Cherry,J.L.細菌の自然集団におけるメチル化誘導性超変異。J. Bacteriol. 200, https://doi.org/10.1128/JB.00371-18 (2018).
Cherry, J. L. Extreme C-to-A Hypermutation at a Site of Cytosine-N4 Methylation. mBio 12, https://doi.org/10.1128/mBio.00172-21 (2021).
バクテロイデス:良いこと、悪いこと、そして細かいこと。Clin. Microbiol. Rev. 20, 593-621 (2007).
論文 CAS PubMed PubMed Central Google Scholar
ヒト大腸内細菌叢によるプロピオン酸および酪酸の生成。Environ. Microbiol. 19, 29-41 (2017).
論文 CAS PubMed Google Scholar
微生物叢を覗く窓としてのバクテロイデス(Wexler, A. G. & Goodman, A. L. An insider's perspective: bacteroides as a window into the microbiome. Nat. Microbiol. 2, 17026 (2017).
論文 CAS PubMed PubMed Central Google Scholar
Feng, J. et al. バクテロイデスにおける多糖利用遺伝子座は、集団のフィットネスとコミュニティレベルの相互作用を決定する。Cell Host Microbe 30, 200-215.e212 (2022).
論文 CAS PubMed PubMed Central Google Scholar
ヨーロッパにおけるBacteroides fragilisグループ分離株の抗菌薬感受性:20年間の経験。Clin. Microbiol. Infect. 17, 371-379 (2011).
論文 CAS PubMed Google Scholar
細菌性抗菌薬耐性菌の種依存性耐性メカニズムを明らかにし、耐性菌予測臨床ツールを検証した。
論文 PubMed Google Scholar
細菌相の変化、抗生物質耐性、宿主の腸内適応を仲介する不可逆的プロモーター。Science 363, 181-187 (2019).
論文 CAS PubMed PubMed Central Google Scholar
Glondin, J. M., Tamura, K., Dejean, G., Abbott, D. W. & Brumer, H. Polysaccharide utilization loci: fueling microbial communities. J. Bacteriol. 199, https://doi.org/10.1128/JB.00860-16 (2017).
Bacteroides mobilizable transposon Tn4555は、グラム陽性菌エレメントTn916と同様の部位特異的組換え機構で統合する。J. Bacteriol. 179, 2731-2739 (1997).
論文 CAS PubMed PubMed Central Google Scholar
遺伝子発現を解析するためのデータベース。Nucleic Acids Res. 43, D593-D598 (2015).
論文 CAS PubMed Google Scholar
Saffert, R. T. et al. グラム陰性桿菌同定のためのBruker Biotyperマトリックス支援レーザー脱離イオン化飛行時間質量分析計とBD Phoenix自動微生物学システムの比較。J. Clin. Microbiol. 49, 887-892 (2011).
論文 PubMed PubMed Central Google Scholar
Bacteroides fragilisグループの同定、抗菌薬耐性、分類学および臨床的意義に関する最新情報。J. Clin. Microbiol 60, e0236120 (2022).
論文 PubMed Google Scholar
ゲノム分類データベースを用いてゲノムを分類するツールキット。Bioinformatics 36, 1925-1927 (2019).
論文 PubMed PubMed Central Google Scholar
Gautreau, G. et al. PPanGGOLiN: depicting microbial diversity via a partitioned pangenome graph. PLoS Comput Biol.
論文 PubMed PubMed Central Google Scholar
Pasolli、E. et al. 年齢、地理、ライフスタイルにまたがるメタゲノムから15万以上のゲノムを抽出し、未解明のヒトマイクロバイオームの多様性を明らかにした。Cell 176, 649-662.e620 (2019).
論文 CAS PubMed PubMed Central Google Scholar
Bazin, A., Gautreau, G., Medigue, C., Vallenet, D. & Calteau, A. panRGP: a pangenome-based method to predict genomic islands and explore their diversity. バイオインフォマティクス 36, i651-i658 (2020).
論文 CAS PubMed Google Scholar
腸内細菌科における抗菌薬耐性遺伝子を持つプラスミド. J. Antimicrob. Chemother. 73, 1121-1137 (2018).
論文 CAS PubMed Google Scholar
バクテリオファージオーファンDNAメチルトランスフェラーゼ:その細菌起源、機能、および発生からの考察。Appl Environ. Microbiol 79, 7547-7555 (2013).
論文 CAS PubMed PubMed Central Google Scholar
Tn7様トランスポゾンのカーゴ遺伝子は、防御システム、移動性遺伝要素、抗生物質耐性遺伝子など非常に多様である。
論文 PubMed Google Scholar
オリベイラ、P. H., タッチオン、M. & ロシャ、E. P. 制限修飾システムと移動性遺伝要素およびその原核生物宿主との相互作用。Nucleic Acids Res. 42, 10618-10631 (2014).
論文 CAS PubMed PubMed Central Google Scholar
ウイルス発見と配列アノテーションを民主化するCenote-Taker 2。ウイルス進化学 7, veaa100 (2021).
論文 PubMed Google Scholar
Nayfach, S. et al. CheckVはメタゲノムから構築されたウイルスゲノムの品質と完全性を評価する。Nat. Biotechnol. https://doi.org/10.1038/s41587-020-00774-7 (2020).
Tourancheau、A., Mead、E. A., Zhang, X. S. & Fang, G. ナノポアシークエンシングを用いた細菌およびマイクロバイオームからの複数種類のDNAメチル化の発見。Nat. Methods 18, 491-498 (2021).
論文 CAS PubMed PubMed Central Google Scholar
Bottacini、F. et al. 比較ゲノムおよびメチローム解析から明らかになった腸内常在菌Bifidobacterium breveの制限/修飾系の多様性。Nucleic Acids Res. 46, 1860-1877 (2018).
論文 CAS PubMed Google Scholar
抗生物質耐性とエピジェネティクス:目に見える以上のもの。Antimicrob. Agents Chemother. 64, https://doi.org/10.1128/AAC.02225-19 (2020).
原核生物のエピゲノムランドスケープ。PLoS Genet 12, e1005854 (2016).
論文 PubMed PubMed Central Google Scholar
Modlin, S. J. et al. 結核菌複合体臨床分離株93株のDNAアデニン・メチロームにおける多様性の推進力と部位。Elife 9, https://doi.org/10.7554/eLife.58542 (2020).
また、このような解析の結果、DNAメチロームの多様性が明らかになった。J. Comput Biol. 24, 1138-1143 (2017).
論文 CAS PubMed Google Scholar
SPAdes:新しいゲノムアセンブリーアルゴリズムとシングルセルシーケンスへの応用。J. Comput Biol. 19, 455-477 (2012).
論文 MathSciNet CAS PubMed PubMed Central Google Scholar
ゲノム配列の解析と、その解析結果を利用した遺伝子発現解析。Genome Res. 25, 1043-1055 (2015).
論文 CAS PubMed PubMed Central Google Scholar
Pilon:包括的な微生物バリアント検出とゲノムアセンブリ改良のための統合ツール。PLoS One 9, e112963 (2014).
論文 PubMed PubMed Central Google Scholar
Molder、F. 他:Snakemakeを用いた持続可能なデータ解析。F1000Res 10, 33 (2021).
論文 PubMed PubMed Central Google Scholar
Kolmogorov, M., Yuan, J., Lin, Y. & Pevzner, P. A. 繰り返しグラフを用いた、長くエラーが起こりやすいリードのアセンブリー。Nat. Biotechnol. 37, 540-546 (2019).
論文 CAS PubMed Google Scholar
ゲノムアセンブリーは、ゲノムアセンブリーで重要な役割を果たすが、ゲノムアセンブリーで重要な役割を果たすのは、ゲノムアセンブリーで重要な役割を果たすのは、ゲノムアセンブリーで重要な役割を果たすのは、ゲノムアセンブリーで重要な役割を果たすのは、ゲノムアセンブリーで重要な役割を果たす。Genome Res. 27, 737-746 (2017).
論文 CAS PubMed PubMed Central Google Scholar
Canu:適応的k-mer重み付けとリピート分離によるスケーラブルで高精度なロングリードアセンブリ。Genome Res. 27, 722-736 (2017).
論文 CAS PubMed PubMed Central Google Scholar
Hunt, M. et al. Circlator: Long sequencing readsを用いたゲノムアセンブリの自動循環化。ゲノム生物学 16, 294 (2015).
論文 PubMed PubMed Central Google Scholar
Gepard:ゲノムスケールでドットプロットを作成するための迅速かつ高感度なツール。バイオインフォマティクス 23, 1026-1028 (2007).
論文 CAS PubMed Google Scholar
原核生物のゲノムアノテーションを迅速に行うツール。バイオインフォマティクス 30, 2068-2069 (2014).
論文 CAS PubMed Google Scholar
米国国立生物工学情報センター(National Center for Biotechnology Information)のデータベース。Nucleic Acids Res. 49, D10-D17 (2021).
論文 CAS PubMed Google Scholar
MEGAN community edition - 大規模マイクロバイオームシーケンスデータのインタラクティブな探索と解析。PLoS Comput. Biol. 12, e1004957 (2016).
論文 PubMed PubMed Central Google Scholar
DIAMONDを用いた高速かつ高感度なタンパク質アラインメント。Nat. Methods 12, 59-60 (2015).
論文 CAS PubMed Google Scholar
Arumugam, K. et al. フレームシフト補正されたロングリードメタゲノムデータからの注釈付き細菌染色体。Microbiome 7, 61 (2019).
論文 PubMed PubMed Central Google Scholar
多座配列解析によるバクテロイデス属の同定と分類. Microbiol. (Read.) 157, 3388-3397 (2011).
論文 Google Scholar
Camacho, C. et al. BLAST+: アーキテクチャとアプリケーション. BMC Bioinforma. 10, 421 (2009).
論文 Google Scholar
Edgar, R. C. MUSCLE: 高精度・高スループットの多重配列アライメント。このデータベースは、遺伝子発現を解析するためのデータベースです。
論文 CAS PubMed PubMed Central Google Scholar
遺伝子発現を解析した結果をまとめたデータベース。バイオインフォマティクス 25, 1972-1973 (2009).
論文 CAS PubMed PubMed Central Google Scholar
遺伝子発現を解析するツール。バイオインフォマティクス 30, 1312-1313 (2014).
論文 CAS PubMed PubMed Central Google Scholar
筑波大学大学院数理物質科学研究科博士課程修了。Curr. Protoc. Bioinforma. 69, e96 (2020).
Google Scholar
Ondov, B. D. et al. Mash: MinHashを用いたゲノムおよびメタゲノム距離の高速推定。ゲノム生物学 17, 132 (2016).
論文 PubMed PubMed Central Google Scholar
多次元ゲノムデータのパターンと相関を明らかにする複雑なヒートマップ。バイオインフォマティクス 32, 2847-2849 (2016).
論文 CAS PubMed Google Scholar
後天性抗菌薬耐性遺伝子の同定。J. Antimicrob. Chemother. 67, 2640-2644 (2012).
論文 CAS PubMed PubMed Central Google Scholar
臨床多剤耐性Bacteroides fragilis分離株の完全ハイブリッドゲノム解析により抗菌薬耐性遺伝子とプラスミドを網羅的に同定した。Microb. Genom. 5. https://doi.org/10.1099/mgen.0.000312 (2019).
Feldgarden, M. et al. Validating the AMRFinder Tool and Resistance Gene Database by Using Antimicrobial Resistance Genotype-Phenotype Correlations in a Collection of Isolates. Antimicrob. Agents Chemother. 63, https://doi.org/10.1128/AAC.00483-19 (2019).
Jia, B. et al. CARD 2017: Comprehensive antibiotic resistance databaseの拡張とモデル中心のキュレーション。Nucleic Acids Res. 45, D566-D573 (2017).
論文 CAS PubMed Google Scholar
微生物パンゲノミクスのためのRパッケージ。BMC Bioinforma. 16, 79 (2015).
論文 Google Scholar
PADLOCを用いた細菌と古細菌の抗ウイルス防御システムの同定と分類により、新しいシステムタイプが明らかになった。Nucleic Acids Res. 49, 10868-10878 (2021).
論文 CAS PubMed PubMed Central Google Scholar
HMM検索を高速化したEddy, S. R. 論文 CAS.
論文 MathSciNet CAS PubMed PubMed Central Google Scholar
ゲノム配列の解析に使用されるゲノム配列の解析結果をまとめたデータベース。Microb. Genom. 4, https://doi.org/10.1099/mgen.0.000206 (2018).
CDD/SPARCLE:2020年の保存ドメインデータベース。Nucleic Acids Res. 48, D265-D268 (2020).
論文 CAS PubMed Google Scholar
ゲノム配列、遺伝子配列、遺伝子発現、遺伝子発現頻度、遺伝子発現頻度、遺伝子発現頻度、遺伝子発現頻度、遺伝子発現頻度、遺伝子発現頻度、遺伝子発現頻度、遺伝子発現頻度。ゲノム研究 13, 2498-2504 (2003).
論文 CAS PubMed PubMed Central Google Scholar
遺伝子クラスターの比較図を自動生成するClinker & clustermap.js. Bioinformatics, https://doi.org/10.1093/bioinformatics/btab007 (2021).
SeqKit:FASTA/Qファイル操作のためのクロスプラットフォーム・超高速ツールキット。PLoS One 11, e0163962 (2016).
論文 PubMed PubMed Central Google Scholar
参考文献のダウンロード
謝辞
NIH Clinical CenterのDept. Lab MedicineのMicrobiology Serviceのスタッフの技術サポートに感謝し、PacBioゲノムのアセンブリーにはNISCのMorgan Park氏に感謝する。本研究は、米国国立アレルギー感染症研究所(NIAID)の学内研究プログラムの助成を受け、NIH HPC Biowulf clusterの計算資源を利用した。(http://hpc.nih.gov)。本研究で表明された内容および見解は著者のものであり、必ずしもNIHまたは米国政府の公式見解を表すものではない。
資金提供
米国国立衛生研究所(NIH)よりオープンアクセスの資金提供を受けた。
著者情報
著者情報
マイケル・J・ティーザ
現職: 米国テキサス州ヒューストン、ベイラー医科大学、分子ウイルス学・微生物学教室、アルケック・メタゲノミクス・マイクロバイオーム研究センター
デレク・D・N・スミス
発表者 カナダ、オンタリオ州オタワ、環境・気候変動カナダ、生態毒性学・野生動物衛生部門、野生動物毒性学研究セクション
アンドリュー・E・クラーク
現職: 米国テキサス州ダラス、テキサス大学サウスウェスタン医療センター病理部
これらの著者の貢献は同等である: Michael J. Tisza, Derek D. N. Smith.
著者および所属
米国メリーランド州ベセスダ、NIH、NIAID、LCIM、細菌病原・抗菌薬耐性ユニット
マイケル・J・ティッサ、デレク・D・N・スミス、パヴェル・P・キル、ジョン・P・デッカー
米国国立衛生研究所臨床センター、NIH、ベセスダ、メリーランド州、USA
Andrew E. Clark、Jung-Ho Youn、Pavel P. Khil & John P. Dekker
国立ヒトゲノム研究所、NIH、ベセスダ、メリーランド州、USA
Beatrice B. Barnabas, Sean Black, Gerard G. Bouffard, Shelise Y. Brooks, Juyun Crawford, Holly Marfani, Lyudmila Dekhtyar, Joel Han, Shi-Ling Ho, Richelle Legaspi, Quino L. Maduro, Catherine A. Masiello, Jennifer C. McDowell, Casandra Montemayor, James C. Mullikin, Morgan Park, Karen Schandler, Brian Schmidt, Christina Sison, Sirintorn Stantripop, James W. Thomas, Pamela J. Thomas, Meghana Vemulapalli & Alice C. Young.
コンソーシアム
NISC比較シーケンスプログラム
Beatrice B. Barnabas
ショーン・ブラック
ジェラルド・G・ブファール
ブルックス
ジュユン・クロフォード
ホリー・マーファニ
リュドミラ・デクティアル
ジョエル・ハン
ホー・シーリン
リシェル・レガスピ
キノ・L・マドゥロ
キャサリン・A・マシエロ
ジェニファー・C・マクダウェル
カサンドラ・モンテマヨール
ジェームズ・C・マリキン
モーガン・パーク
カレン・シャンドラー
ブライアン・シュミット
クリスティーナ・シソン
シリントーン・スタントリポップ
ジェームズ・W・トーマス
パメラ・J・トーマス
メガーナ・ヴェムラパリ
アリス・C・ヤング
貢献
M.J.T.、D.D.N.S.、A.E.C.、P.P.K.、J.P.D.が本研究を発案し、デザインした。J.P.D.は研究資金の獲得と管理を行った。A.E.C.は分離株の収集とメタデータの管理を行った。A.E.C.とD.D.N.S.は感受性試験を実施した。M.J.T.、D.D.N.S.、A.E.C.、J.-H.Y.はイルミナおよび/またはナノポアゲノムシーケンスを実施した。NHGRI, NIHのNISC Comparative Sequencing Programが、一部の分離株のイルミナおよびPacBioシーケンスを行った。NISCのMorgan ParkがPacBioリードから微生物ゲノムのアセンブリーを行った。M.J.T.とJ.P.D.がNanoporeメチロームシーケンス実験を計画した。M.J.T.がNanoporeメチロームシーケンスとメチロームデータ解析を行った。M.J.T.がDNA Methylase Finderツールを作成し、メチルトランスフェラーゼの同定と解析を行った。M.J.T.、P.P.K.、D.D.N.S.は、ゲノムデータの計算機解析を行い、重要なデータ管理を行った。M.J.T.とD.D.N.S.は一次原稿と補足図を作成した。J.P.D.は本研究を監督した。M.J.T.、D.D.N.S.、P.P.K.およびJ.P.D.は、実験データおよび計算機解析のクリティカルレビューを行った。M.J.T.、D.D.N.S.、A.E.C.、J.P.D.が原稿を執筆・校閲した。全執筆者が原稿の批評と編集を行った。
著者
ジョン・P・デッカー宛。
倫理申告
競合利益
著者らは競合する利益はないと宣言している。
査読
査読情報
Nature Communications誌は、Pedro Oliveira氏と、この論文の査読に貢献してくださった他の匿名の査読者に感謝する。査読ファイルはこちら。
追加情報
出版社からの注記 スプリンガー・ネイチャーは、出版された地図の管轄権の主張および所属機関に関して中立を保っています。
補足情報
報告概要
補足情報
査読ファイル
追加補足ファイルの説明
補足データセット1,2,4-14
権利と許可
オープンアクセス 本論文は、クリエイティブ・コモンズ表示4.0国際ライセンスの下でライセンスされている。このライセンスは、原著者および出典に適切なクレジットを与え、クリエイティブ・コモンズ・ライセンスへのリンクを提供し、変更が加えられたかどうかを示す限り、いかなる媒体または形式においても、使用、共有、翻案、配布、複製を許可するものである。この記事に掲載されている画像やその他の第三者の素材は、その素材へのクレジット表示で別段の指示がない限り、記事のクリエイティブ・コモンズ・ライセンスに含まれています。素材が記事のクリエイティブ・コモンズ・ライセンスに含まれておらず、あなたの意図する利用が法的規制によって許可されていない場合、あるいは許可された利用を超える場合は、著作権者から直接許可を得る必要があります。このライセンスのコピーを見るには、http://creativecommons.org/licenses/by/4.0/。
転載と許可
この記事について
この記事の引用
Tisza, M.J., Smith, D.D.N., Clark, A.E. et al. Roving methyltransferases generate a mosaic epigenetic landscape and influence evolution in Bacteroides fragilis group. Nat Commun 14, 4082 (2023). https://doi.org/10.1038/s41467-023-39892-6
引用文献のダウンロード
2023年1月24日受領
2023年6月29日受理
2023年7月10日発行
DOIhttps://doi.org/10.1038/s41467-023-39892-6
この記事を共有する
以下のリンクをシェアすると、誰でもこのコンテンツを読むことができます:
共有リンクを取得
コンテンツ共有イニシアチブ「Springer Nature SharedIt」提供
テーマ
細菌遺伝子
細菌ゲノム
細菌感染
メチル化解析
ファージ生物学
コメント
コメントを投稿することで、私たちの規約とコミュニティガイドラインに従うことに同意したことになります。誹謗中傷や規約・ガイドラインに反する投稿があった場合は、不適切な投稿としてフラグを立ててください。
ネイチャー・コミュニケーションズ(Nat Commun) ISSN 2041-1723(オンライン)
サイトマップ
ネイチャー・ポートフォリオについて
ネイチャーについて
プレスリリース
プレスオフィス
お問い合わせ
コンテンツを見る
ジャーナルA-Z
テーマ別記事
ナノ
プロトコル交換
ネイチャー・インデックス
出版ポリシー
Natureポートフォリオポリシー
オープンアクセス
著者・研究者サービス
別刷りと許可
研究データ
言語編集
科学編集
ネイチャー・マスタークラス
エキスパートトレーナーによるワークショップ
研究ソリューション
図書館・機関
図書館員サービス&ツール
図書館ポータル
オープンリサーチ
図書館への推薦
広告とパートナーシップ
広告
パートナーシップとサービス
メディアキット
ブランドコンテンツ
キャリア開発
ネイチャー・キャリア
ネイチャーコンファレンス
ネイチャーイベント
地域ウェブサイト
ネイチャー アフリカ
ネイチャー・チャイナ
ネイチャー インド
ネイチャー イタリア
日本のネイチャー
ネイチャー 韓国
ネイチャー 中東
プライバシーポリシー

クッキーの使用

プライバシーポリシー/クッキーの管理
法的通知

アクセシビリティに関する声明

利用規約

アメリカ合衆国のプライバシー権
© 2023 シュプリンガー・ネイチャー・リミテッド

この記事が気に入ったらサポートをしてみませんか?