南極の海洋ウイルスの季節的動態と多様性から、新たなウイルス海景が明らかになった
論文
公開:2024年10月24日
南極の海洋ウイルスの季節的動態と多様性から、新たなウイルス海景が明らかになった
Nature Communications 15巻, 記事番号: 9192 (2024)この記事を引用する
5 Altmetric
概要
季節変動が顕著な南大洋の微生物生態系は、気候変動の影響を受けやすい。ウイルスは微生物の存在量、多様性、進化の重要な調節因子であるため、この地域のウイルスに対する季節性の影響について理解を深める必要がある。南氷洋におけるDNAウイルスの多様性を包括的に調査した結果、ユニークでほとんど未知のウイルスが存在することが明らかになった。分類学的に高いランクにある新規のウイルス分類群を発見し、クラスファージ、ポリントン様ウイルス、ウイルスファージの多様性に関する理解を広げた。Nucleocytoviricotaウイルスは南極ウイルスの中でも豊富で多様なグループであり、植物プランクトンの個体群動態の重要な制御因子としての可能性を強調している。我々の経時的解析により、海洋ウイルス群集(バクテリオファージ、真核生物ウイルス)の複雑な季節的パターンが明らかになり、微生物宿主との明らかな相互作用が強調されるとともに、世界で最も敏感で急速に変化する生態系におけるウイルスの役割についての理解が深まった。
他の人が見ている類似コンテンツ
4つの海洋横断地域における海洋巨大ウイルスの生物地理学的評価
論文公開 2023年4月29日
海洋巨大ウイルスの生物地理学的研究から、真核生物との相互作用や生態系機能が明らかになった
論文2020年09月07日
地球最深部の海に生息するウイルスの多様性と分布
論文2021年 5月 10日
はじめに
ウイルスは、生物多様性の推進役であると同時に、微生物による死亡の原因として広く普及しており、数的にも支配的である1,2,3 。生物バイオマスの3分の2が微生物である海洋では、微生物群集と生物地球化学サイクルの形成に重要な役割を果たしている4。ウイルスの生態学的重要性を理解するには、その多様性を包括的に理解する必要がある。ウイルスメタゲノミクスは海洋ウイルス生態学に革命をもたらし5,6,7 、ウイルス群集構造、生物地球化学的役割、進化の軌跡、分類学的多様性を明らかにした8,9,10,11,12,13 。しかし、南氷洋のような重要な海洋地域については、まだ十分な研究がなされていない14。
南大洋は地球規模の海洋循環において極めて重要であり15 、人為起源の二酸化炭素排出量の40%以上を吸収しているため、気候変動を緩和する上で重要な役割を担っている16 。このプロセスは微生物の活動17によって大きく左右されるため、これらの微生物宿主に対するウイルスの影響を研究する必要性が強調されている。極地の生産シーズンは短いため、(微小)生物学的活動と群集組成の時間的動態が顕著である18,19,20,21 。南極の海洋微生物のウイルス溶解についても、かなりの季節変動が報告されている22,23,24,25,26。しかし、ウイルス群集の多様性と動態に関する理解はまだ限られている。ウイルス群集のメタゲノム解析に取り組んだ数少ない研究は、サンプル数が限られ、サンプリング期間も狭いため、限定的な見解にとどまっている23,27,28,29,30。
本研究では、南極海域のdsDNAウイルス多様性の複雑な季節変動を明らかにする。本研究は、西南極半島に位置するマルグリット湾における全生産期にわたる高い時間分解能(24サンプリング日)を有する。我々は、特定のウイルス分類群に合わせた複数のウイルス検出・分類アプローチを組み合わせることで、海洋ウイルス多様性のカタログを進歩・拡大させる。さらに、ウイルス-宿主動態の季節変動に関する理解が深まったことで、多様性と継承の推進力としての南氷洋におけるウイルスの生態学的重要性が浮き彫りになった。したがって、本研究は、地球規模の気候変動に特に敏感なこの地域の動態を理解するために不可欠な基盤を確立するものである。
研究結果
南極のウイルス群集には多様な分類群が存在する
南極海ウイルスの動態と宿主との相互作用を調べるため、我々はウイルス(0.22 µm未満およびフリーDNA消化)および細胞(0.22 µm以上)サイズ画分から一対のメタゲノムを作成した。合計8億8700万リードのウイルスメタゲノムを161,651個のウイルスカフォールドに共集合し、そのうち8045個が中~高品質(>10 kbまたは>70%CheckV31完全性、補足データ1 )であった。ウイルスリードは、ウイルス分画メタゲノムの59%を占め、平均4%のリードは共アセンブリにマップされなかった(補足図1a )。サンプルの希薄化と生物種の蓄積曲線から、十分深く、十分なサンプルカバレッジでサイトをシーケンスできたことがわかる(補足図2a, b )。ウイルス分画メタゲノムでは、ウイルス配列が明らかに濃縮され、細胞マーカーが枯渇した(補足図1a, b )。中~高品質のウイルス配列は、7957個のvOTUにクラスター化した。中~高品質ウイルスのスキャフォールドをGlobal and Southern OceanViromes8,29(GOVとSOV)と比較したところ、75%のウイルス配列が種のランクで新規であった。
最も頻度が高く豊富なウイルスは、Caudoviricetesクラスの尾状dsDNAバクテリオファージであり(図1a-c )、他のウイルスを53倍上回り、全スカフォールドの75%を占めた(図1b, c )。さらにPhaGCN232を用いて、Caudoviricetesの配列をファミリーランクに分類した。様々なCaudoviricetes分類群について、ウイルス存在量の季節的パターンを見分けることができ、細胞画分ではさらに顕著であった(図1c, d )。ウイルス画分と細胞画分における存在量の異なるパターンは、溶菌性ウイルス感染と溶原性ウイルス感染の季節的動態の結果である可能性がある。例えば、キヤノウイルスは、ウイルスと細胞メタゲノムで異なる出現パターンを示し、ウイルス画分では細胞メタゲノムよりもリード数が少なかった。同様に、オートグラフウイルス科の配列が最も多く(平均11%のウイルス分画と3.5%の細胞分画のリード)、夏にウイルスの生産性が高まり、1月中旬から2月にかけて細胞分画の存在量が高くなったことが反映された(図1c, d )。古細菌ウイルスと同定されたウイルスは少なく(0.36%リード、279スキャフォールド)、11月から1月にかけて存在量が増加し(図1e)、多くはツムレイマウイルス(51スキャフォールド)に分類された。
図1:生産期における南極dsDNAウイルスの分類学的多様性。
a中~高品質ウイルスコンティグ(>10 kbまたは70%完全)の遺伝子共有ネットワークを分類学的分類で色分けしたもの(凡例はパネルbを参照)。ノードのサイズは全ビロームデータセットにおける最大リードアバンダンスを表す。陰影のついたクラスターは、cenote-taker2分類法を重ね合わせて手動で決定した。PhaGCN2を用いて予測されたCaudoviricetesのファミリーレベルの分類。nucleocytoviricota,Maveriviricetes,Polintonviricetes,Crassviralesはコスチュームアプローチで分類された。b各分類ランクに分類されたスキャフォールド数(その他は50スキャフォールド未満のランクを表す)。c-fウイルス分類群のリードアバンダンスは、ウイルス画分(<0.22µm)(c )と細胞画分(>0.22µm)(d )、およびウイルス画分(<0.22 µm)の古細菌ウイルス(f )と真核生物ウイルス(e )について、すべてのスキャフォールドにリードをマッピングし、アバンダンスを全ウイルスリードに対して正規化した。図3cはウイルス粒子の組成と総量である。破線の縦線は、2018年4月から11月までの冬季サンプリングギャップを示す。
豊富な真核生物ウイルスは、Nucleocytoviricota門(もともとは核細胞質大DNAウイルス)、Polintoviricetes綱(ポリントン様ウイルスまたはPLV)およびMaveriviricetes綱(ウイルスファージ)、およびCircoviridae科(ssDNA;図1b、c、f)に属していた。Nucleocytoviricotaウイルス(NCVs)は最も豊富な真核ウイルスで、細胞およびウイルス画分のリードのそれぞれ12.4%と1.6%を占めた。細胞分画におけるNCVの存在量は2018年3月と12月に急増し、ウイルスリードの最大27%と77%(それぞれ)を占め、NCV産生の高まりを示唆した。
PLVはウイルス多様性の重要な部分を形成し、1678のスキャフォールドを占めた。このうち53個はCheckVの完全性が50%以上であり、6個は末端反復を含んでいた。合計243個が10kbを超え、その長さは通常20kb前後であることから、ほぼ完全なゲノムである可能性が高い33,34。PLVもリードのかなりの割合を占め、細胞分画では平均3.5%、ウイルス分画では平均1.2%であった(図1d, e )。2019年1月の細胞分画におけるウイルスリードの最大27%は、真核生物に広く存在する内因性ウイルスエレメント33であることから、おそらく溶菌性ウイルス感染というよりも、細胞宿主の存在量の増加を反映していると考えられる。一方、ウイルス画分におけるそれらの存在量と検出は、活発な感染状態への移行を示す可能性が高い。
使用されている標準的なイルミナライブラリー調製法はssDNAウイルスに偏っているが35 、我々はマイクロウイルス科(非エンベロープ型バクテリオファージ)に属する5つのスカフォールド、糸状のイノウイルス科(どちらも細菌に感染)に属する2つのスカフォールド、そして真核生物に特異的なサーコウイルス科に属する16のスカフォールドを同定した36 。ssDNAウイルスに偏った方法を用いた過去の調査では、依然としてdsDNAウイルスが優勢であった28。
南極ウイルスの多様性は季節変化に対応する
ウイルス群集はサンプリング期間中に変化し、4つの異なるクラスター(図2a、b)に区分することができた。初夏(クラスターD)は、水温が低く、塩分濃度が高く、溶存無機栄養塩濃度が高く、クロロフィルa(Chl-a)濃度が低く、バクテリアとウイルスが少ないことが特徴である。真夏(クラスターA)は、水温の上昇によって海氷が融解し、塩分濃度が低下して成層が強まった(混合層深度が浅くなった)。その結果、光合成活性放射量(PAR)が増加し、Chl-a濃度と栄養塩の枯渇がピークに達した。晩夏(クラスターC)では、Chl-a濃度と原核生物量が減少し、ウイルス量がピークに達した。このクラスターはまた、気温の上昇、海氷被覆の減少、相対的な栄養塩濃度の低下とも一致した。秋の始まり(クラスターB)には、風の活動が活発化し、気温が低下したため、混合と海氷形成が増加し(栄養塩濃度が補充され、塩分濃度が上昇)、微生物生産性が低下した(低Chl-aと微生物現存量)37。2018年2月と2019年2月は2つの別々のクラスター(それぞれCとA)に入り、ある程度の経年変動があることを示している。
図2:ウイルス多様性の季節動態。
a中~高品質スキャフォールド(> 10 kbまたは70%完全)のclr変換スキャフォールド垂直カバレッジ(スキャフォールド長で正規化したリードアバンダンス)のサンプリング日ごとのヒートマップ。b 関連する環境変数の変化。物理変数としては温度、塩分、混合層の深さ、光合成活性放射(PAR)、氷被覆、化学変数としてはリン、全窒素、ケイ酸塩、窒素/リン比(N:P比)、生物変数としては全クロロフィルa(Chl-a)、<20 µmクロロフィルa、原核細胞数、ウイルス粒子数を含む。ヒートマップ(a,b )は、clr変換したウイルス量の階層的クラスタリングに従って縦にソートされている(右のデンドログラム)。c中~高品質スキャフォールドの支配的なウイルススキャフォールド(存在量が0.1%以上)の構成累積ウイルス垂直カバレッジ。棒グラフの色は1日あたりの優勢ウイルス足場の数を表し、黒い点は同じ日のフローサイトメトリーによるウイルス粒子数を表す。ベン図は、異なる期間間の共有および独自の優勢ウイルス足場数を示す。dウイルス足場数の多い期間と少ない期間のサンプル(n= 24)の有効種数(ENS)で表したシャノン多様性(箱プロットは中央値±四分位数、ひげは点範囲)。
多変量回帰モデルを用いて、ウイルス群集組成の環境決定因子を評価した。温度と塩分濃度は群集分散の31%を説明し(それぞれp-value=0.001と0.004)、さらに23%は無機リン酸(p-value=0.001)、窒素リン比(p-value=0.016)、PAR(p-value=0.077)で説明された。ウイルス群集組成と微生物群集組成の相関関係(補足図3)は、ペアワイズ-アイチソン距離を比較することで調べた。微生物群集組成全体は、環境変数をコントロールした場合、ウイルス群集の変動の68%を説明した(部分マンテルr統計=0.6842、p値=0.01)。一方、原核生物群集組成とファージ群集単独では、部分マンテルr統計量は0.3411で、p値は0.002であった。
優勢なウイルスの存在量と時間的動態は、フローサイトメトリーによる総ウイルス数を反映し(図2c;R2 = 0.82、p-値 = 9.5 ×10-7 )、細菌(ブルーム)の動態に追随した(図3a)。晩夏のウイルス群集は、11月から1月中旬に比べ、支配的なウイルス(96%がCaudoviricetes; 補足データ1)の寄与率(および数)が高かった(図2c)。その結果、ウイルス量が多い時期には、ウイルス群集はこの少数のウイルスに大きく偏り、アルファ多様性の減少につながった(図2dおよび補足図2c-e)。全体として、これらの結果は、季節の異なる時期における明確なウイルス群集を浮き彫りにした(図2c)。
図3:バクテリオファージと原核生物の宿主動態。
aフローサイトメトリーによって決定された原核生物の絶対量とクロロフィルa濃度。bPhyloFlashによってクラスランクで組み立てられた16S rRNA遺伝子アセンブリーによって決定された原核生物の相対量(0.2 µm以上の原核生物リードの割合)。dバクテリオファージの相対存在量(バクテリオファージリードの%、<0.2 µm)予測される宿主クラスに従って色分けされた中〜高品質の原核生物ウイルス(10 kbより長いか、70%完全)。eインテグラーゼを含むウイルスカフォールドの存在量を、ウイルス画分(<0.22 µm)の垂直カバレッジ(スカフォールド塩基あたりの読み取り塩基数)で表したもの。灰色の破線は冬のサンプリングギャップを示す。
豊富な南極バクテリオファージは共存する細菌分類群に感染する
統合型バクテリオファージ宿主予測ツールiPHoP38を用いて、2412個のウイルススキャフォールドの宿主を予測した。これらのスキャフォールドは、中~高品質バクテリオファージゲノムにマッピングされたリードの48%をカバーし(図3d)、vContact2遺伝子共有ネットワーク解析と一致した(補足図4)。ほとんどのバクテリオファージは、3つの優勢な細菌クラスのいずれかを標的としていた(図3): iPHoPが予測した古細菌に感染するウイルスは59種類で、古細菌(図3a)や古細菌クラスター・ウイルス(図1e)の季節的な多さとは対照的に、2月にピークを示した(図3c)。
ガンマプロテオバクテリアに感染するバクテリオファージは、優勢なファージの25%を占め(補足データ1)、季節的なウイルス生産に重要な役割を果たしていることが示唆された。12月には、ガンマプロテオバクテリア(主にOceanospirillales)がバクテリオファージよりも先に顕著に増加した(図3b-d)。晩夏(3月)には、ガンマプロテオバクテリアのバクテリオファージ量は比較的高く、増加傾向にあったが、宿主量は特に高くなかった(図3d )。一方、フラボバクテリア属のバクテリオファージは12月から1月にかけて、宿主とともに着実に増加した(ほとんどがポラリバクター)。アルファプロテオバクテリア(Alphaproteobacteria)感染型バクテリオファージは、シーズン終了時(4月)に最も多く、次のシーズンの開始時(11月)にも比較的多く、予測される宿主(ほとんどがSAR11)の存在量が最も多い時期と一致した。その後、12月から1月にかけて、宿主の個体数はバクテリオファージの個体数よりも急速に減少した。
細菌ブルームの発生に伴う温帯バクテリオファージの再活性化
溶原性感染の高い流行が南氷洋全域で報告されており22,23,25 、南極バクテリオファージの越冬生存に関与している可能性がある23 。温帯バクテリオファージの季節的動態を解明するために、溶原化とプロファージの再活性化に関与する遺伝子を含むウイルスの足場(図3eと補足図5)の存在量をモニターした(特にインテグラーゼ(n= 2502)、エクジシジョナーゼ(n= 40)、バクテリオファージ抑制タンパク質(n= 134))。中~高品質のファージ配列のうち、386個が少なくとも1つの溶原性遺伝子を有していた。すべての遺伝子は、細胞分画とウイルス分画で同様の季節的パターンを示した(補足図5)。平均垂直カバレッジ(スキャフォールドの長さで正規化したリードアバンダンス)は25,157 bpbp-1で、インテグラーゼを含むスキャフォールドが最も多かった(全ウイルス垂直カバレッジの2.4%)。これらのウイルスは真夏から晩夏にかけて最も多く存在し(補足図5)、これは細菌数の増加と一致した(図3a)。
南極海域には新規かつ多様なクラスウイルス属バクテリオファージが生息している
我々のターゲット解析により、62の新規クラスファ-ジ配列(クラスジラ目)が同定された。このうち17個は50kbより長く、18個はCheckVによると少なくとも50%以上、7個は95%以上の完全性を持ち、2個は直接末端反復を持つ。ターミナーゼラージサブユニット(TerL)の系統樹(図4a)は、これらの配列がCrassvirales目の中に系統学的に位置づけられ、さらにファミリーランクに分類されることを検証した。ほとんどのスキャフォールドは、C1〜C4(図4a, b)とラベルされた既知のクラスビラ属の多様性の中で新しいクレードにクラスタリングされ、新しいクラスファージファミリーになることが期待される。さらに、20のスキャフォールドがSteigviridaeファミリー(クレードSt、図4)に属し、これは海洋自由生活性フラボバクテリアに感染するCellulophagaファージΦ14:2を包含する42,43 。さらに、ポータル・タンパク質(Portal,n= 51)とメジャー・キャプシド・タンパク質(MCP,n= 37, 補足図6a, b )の系統樹でファミリー配置を確認した。これらのクラスファージは、クラスビラレスのメンバーとして典型的な遺伝子含量と構成を示し(図4c )、30個のコア遺伝子44はすべて、南極のクラスビラレス・スカフォールドの少なくとも1つで同定された(補足図6c )。クレードC2が最も多様性と有病率が高く、いくつかのウイルスはシーズンを通して存続し、他のウイルスは秋(4月)と初夏(11月から1月)にのみ検出された。
図4:南極カラスウイルス群の多様性と動態。
aAntarcticCrassviralesscaffoldsと参照Crassvirusesのターミナーゼラージサブユニット(TerL)の根なし最尤系統樹。b系統樹のクラスウイルス目セクションを左に示す。現存する5つの科の参照配列は、南極のサンプルからの配列が散在するSteigviridaeを除き、折りたたまれている。ウイルス分画(< 0.22 µm)の垂直カバレッジ(スキャフォールド長で正規化したリードアバンダンス)をヒートマップで示す。注釈付き遺伝子はゲノムマップ全体で一貫して色分けされている。タンパク質の略号は以下の通り、主要カプシドタンパク質(MCP)、ポータルタンパク質、推定構造タンパク質(遺伝子73-75、77および86)、統合宿主因子サブユニット(IHF 53および54)、尾部安定化タンパク質(Tstab)、PD-(D/E)XKファミリーヌクレアーゼ(PDDEXK)、 クラスウイルス未特性遺伝子49、DnaGファミリープライマーゼ、レプリソームオーガナイザープロテイン(Rep_Org)、SNF2ヘリカーゼ、DNAポリメラーゼファミリーA(PolA)、SF1ヘリカーゼ、AAAドメインATPase(ATP_43b)、ファージ複製ヘリカーゼ(DnaB)、メタロフォスファターゼ(MPP)、尾部管状タンパク質(Ttub)、dUTPase(dUTP)。
Nucleocytoviricotaウイルスは、多様で豊富な南極真核生物ウイルス群である。
多くのNCVの大きなゲノムと粒子サイズ45を考慮し、我々はウイルス画分と細胞画分の両方でメタゲノムビニングを用いてその多様性を特徴付けた。その結果、88のビン(図5a、補足データ2)が得られ、それらは系統学的にImitervirales目(n= 51)、Algavirales目(n= 15)、Pandoravirales目候補46(n= 4)およびPimascovirales目候補(n= 4)、Mriyaviricetes目候補47(n= 9)に分類された。さらに、NCVs48と系統学的マーカー遺伝子を共有するMirusviricota 候補門に属する5つのビンを発見した。
図5:南極海NCVの多様性と季節動態。
a7つのマーカー遺伝子の連結に基づく、南極NCV、Mirusviricota、および分離株と海洋メタゲノム調査からの参照ゲノムの根なし最尤系統樹。b細胞分画メタゲノム(> 0.22um)のシーケンス垂直アバンダンス(ビン長で正規化したリードアバンダンス、対数スケール)の時間的ダイナミクス。ヒートマップは系統的に整理されており(ミラスウイルスとNCVの間にルートがある)、最初の列は分類を表している(パネルaを参照)。c細胞分画メタゲノムのビン垂直カバレッジにおけるファミリーレベルでの時間的ダイナミクス(ビン長で正規化したリードアバンダンス)。灰色の破線は、2018年4月から11月までの冬季サンプリングギャップを示す。ウイルスの略号は以下の通り、Phaeocystis globosaウイルス(PgVs)、Chrysochromulina ericinaおよびC. parvaウイルス(CeVおよびCpV)、Prymnesium kappaウイルス(PkV)、Pyramimonas orientalisウイルス(PoV)Tetraselmissp. ウイルス(TetV)、Heterosigma akashiwoウイルス(HaV)、Bathycoccus prasinos(BpV)、Ostreococcus tauri(OtV)、Micromonas pusillaウイルス(MpV)、Aureococcus anophagefferensウイルス(AaV)、Emiliania huxleyiウイルス(EhVs)。
ImiterviralesのビンのほとんどはMesomimiviridae科に属し(n= 25)、そのうち5つは珪藻類のPhaeocystis globosaと Chrysochromulina ericinaに感染するウイルスを含むTethysvirus属に属していた49,50 。1つの流行しているテチスウイルスの12月のピーク(図5b、c )は、最も豊富な稚水生生物であるP. antarctica(補足図3c )の減少と一致した(2018年2月9日と3月6日を除き、稚水生生物rRNA遺伝子リードの99%以上)。これらのうち、ビン2-643264.cc.b128は全NCVの中で最も豊富であり、P. globosaウイルスに近縁であった。残りのImiterviralesに関連する20のビンはSchizomimiviridae科に属し、特にウイルス画分では夏の終わりに存在量がピークに達した(図5b )(補足図7 )。残りの6種のImiterviralesウイルスはAllomimiviridae科に属し、晩夏(2〜3月;図5b、c)に出現した。
Algaviralesウイルスの多くは候補のPrasinoviridae科AG_01に属し(n= 10)、うち6種はPrasinovirus属に属していた。さらに、1個体がAG_3科に、3個体がAG_04科(Raphidovirus-like )に属し、秋から初夏にかけて細胞分画に多く見られた(図5b, c )。プラシノウイルスのbin vRhyme.bin.4783とAG_01のbin vRhyme.bin.4827は、ウイルス画分中に生産期を通して残存していた(補足図7)。
9つのMriyavirusはすべてGamadviridae科の候補に属し、細胞分画から回収されたより大きなビンに挿入されていた。これらのビンのうち8つは真核生物の含有率が高く、2つは未分類の真核生物、6つはPhaeocystis antarcticaと分類された(補足データ2 )。我々は、これらのウイルスが宿主とともにビンに分類され、温帯感染または持続感染を表している(補足データ2 )と仮定しているが、これはPhaeocystis51や他の真核生物47のゲノムアセンブリー内に存在することと一致している。さらに、Mirusviricota48門の候補として5つのビンが細胞分画で同定された(図5b, c )。最後に、8個のNCVが検出され、そのうちの4個はPimascovirales目(Pithovirus属、Marseillevirus属を含む)に属し、4個はPandoravirales目46と提案されている。細胞分画NCV組成は、環境変数をコントロールしながら、真核生物組成と共変動した(partial Mantel r-statistic 0.2888,p-value 0.001)。
南極ウイルスファージとポリントン様ウイルスは、これらのグループの既知の多様性を拡大する。
南極ウイルスとポリントン様ウイルスの系統樹を調べることにより、1678のPLVと57のウイルスファージが同定された。ほとんどのPLVとウイルスファージは、MCP以外のウイルスの特徴、例えばパッケージングATPアーゼや、ポリメラーゼB、プライマーゼ・ヘリカーゼ、ヘリカーゼなどの複製関連遺伝子をもっていた(図6c, d )。オムニリムノビロウィルス科のウィルスは、他のウィルファージよりもTsVやPgVV群のPLVと多くの遺伝子を共有しているようである。同様に、ChiグループのPLVは他のPLVよりもvirophageと多くの遺伝子を共有しているようで、その複雑な進化関係を反映している53。
図6:南極ウイルス病原体とポリントン様ウイルス。
(a)ウイロファージ(vp,Maverivicetes)と(b)ポリントン様ウイルス(PLV,Polintoviricetes)の主要キャプシドタンパク質(MCP)の系統樹を示す。ビロファージファミリーとPLVのクレード名は文献29,37,38による。29,37,38. (c)5kbより長いビロファージ、(d)10kbより長いPLVの上位30種の系統樹と、それに対応するウイルス画分(<0.22 µm)のメタゲノム存在量のヒートマップ、および注釈付きゲノムマップ。タンパク質の略号は以下の通り、FtsK-HerAファミリーDNAパッケージングATPアーゼ(ATP)、ジオキシゲナーゼ(Dioxyg)、エンドヌクレアーゼ(Endo)、GIY-YIGヌクレアーゼドメイン(GIY)、繊維様タンパク質(Fibre)、グリコシルトランスフェラーゼ(Glycotr)、リガーゼ(Lig)、リパーゼ(Lip)、 メチルトランスフェラーゼ(Mthyltr)、ヌクレオチジルトランスフェラーゼ(Nuctr)、ペントン(Pen)、タンパク質プライムポリメラーゼB(pPolB)、プライマーゼ-ヘリカーゼ(Prim-Hel)、ヘリカーゼ(Hel)、成熟システリンプロテアーゼ(Pro)、未特性タンパク質(Tlr6F)、推定チロシン組換え酵素(YR)。灰色の破線は冬のサンプリングギャップを示す。
ウイロファージについては、最近更新された分類学的枠組み52を適用した。ほとんどの配列はスプートニビロウィルス科(n= 13)とオムニリムノビロウィルス科(n= 12)に属していた。最も豊富なウイロファージ(NODE_23824)は後者の科に属し、南極の有機湖ウイロファージに近縁である54。注目すべきは、30個のウイロファージからなるMCPクレードが同定されたことで、新規のウイロファージファミリーを形成している可能性が高いことである(図6a)。このクレードの中で、NODE_3533というウイロファージ配列は、コア遺伝子と直接末端反復配列を持つ23.9 kbの完全なゲノムを持つと推定される(図6c)。この配列はNODE_23824とともに1月に多く見られたが、NODE_6367と_4538は3月に最も多く見られた。NODE_29197だけがシーズン開始時と終了時に優勢であった。
これらのウイロファージのプロモーターモチーフと、共存するNCVの後期転写プロモーターモチーフ(補足データ3および図6c)を一致させることで、これらのウイロファージと推定されるNCVを同定した。スプートニビロウィルス科の南極ウイルスファージは、2つのメソミミウィルス、および1つのシゾミミウィルスと一致した。オムニリムノビロウィルス科では、1つがメソミミウィルスと、2つがプラシノウィルスと一致した。新規クレードは、ほとんどがプラシノウイルス、メソミミウイルスと一致し、1つはシゾミミウイルス、ミルスウイルス、パンドラウイルスと一致した。
ほとんどのクレードには正式な分類がないため、我々はこのグループに関する過去の調査34,57に基づいてPLVを分類した。驚くべきことに、南極のPLVは、オピストコンタゲノムに内在するMCPや動物のアディントウイルスを多く含むクレードAとBを除き、ほとんどのMCP系統群に生息していた(図6 b )。また、以前のクレードX40とクラスターTriMCP57のウイルスを参考に、3つの独立したグループ(X1、X2、X3)を定義することができた。これらのグループは、高度に分岐したMCP遺伝子の3重化を示す単一のPLVから生じたようである(図6bおよび補足図9a )。同じPLVに由来するMCPは、一般的にTSVではグループXよりも近縁であり、その系統学的距離はグループXよりも平均2.4倍大きい(p値 < 2.2E-16、t検定)。さらに、この距離はTsVグループの異なるPLVからのMCP間よりも平均で2.26倍小さい(p値<2.2E-16、t検定)。グループXでは、MCPが3つ以下の短い配列は不完全である可能性が高い(補足図9 )。これらのPLVのMCP(n= 1387)の多くは、これら3つのグループ内で新しいクレードを構成している。残りの291の南極PLVのほとんどはChi, TsV, PgVVグループに属し、いくつかのPLVは異なる南極クレードを形成している(図6b )。最も出現数の多い30種のPLV(>10 kb)のうち、約半数は2月に、その他は秋から初夏にかけて流行した(図6d)。これらのウイルスがNCVに寄生している可能性を、Gezel-14Tで見つかったように、そのプロモーターモチーフをNCV初期転写プロモーターモチーフ'WWWWWTGWWWWWW'とマッチさせることによって調べた(補足データ3および図6d )。その結果、PgVVクレードの19%、X1-3およびChiクレードの11%、TsVクレードの6%が5kbより長くマッチした。
考察
本研究は、GOV8およびSOV29データセットには75%のウイルス種が存在しなかった、南極表層水域における非常にユニークな海洋DNAウイルス多様性の詳細な特徴を明らかにした。SOVとの重複が限られていることから、南極のビロームには高い変動性があることが示された。全体として、これらの知見は、南氷洋がウイルスの多様性に関して未解明な地域であることを強調しており、この地域におけるさらなる包括的研究の必要性を強調している。高い割合で新種のウイルスが同定されただけでなく、我々の包括的なアプローチにより、より高い分類学的ランクで新たな多様性が発見された。多くの代表を持つ4つの新しいクラスウイルス科、C2およびC4の発見は、霊長類の腸内マイクロバイオームを超えて、クラスファージの多様性とその環境範囲についての理解を大きく広げた43,58 。南極で新たに発見されたクラスファージの多様性から、海洋およびその他の非宿主関連環境におけるこのクラスの多様性と活性について、さらなる調査が必要である。公開されているデータ・リポジトリを調査すれば、新たに発見された系統のさらなるメンバーが見つかるかもしれない。これらのウイルスは、マルグリット湾の細菌群集の重要な構成要素である南極バクテロイデーテス( Flavobacteria、Sphingobacteriia、Saprospiria、Cytophagiaの各クラス)にも同様に感染する可能性がある。同様に、我々は新規のウイルスファージファミリーを発見し、このファミリーの完全なゲノムを回収することに成功した。ビロファージは共存するNCVと複製し、マウイルスのように宿主をNCVから集団レベルで防御する場合もある60 、61 。ビロファージは感染しているNCVの転写機構に寄生するので、巨大ウイルスとビロファージの遺伝子プロモーターモチーフはしばしば検出可能な類似性を共有している。われわれの解析では、推定されるプロモーターによって、ウイロファージと共存するNCVとのマッチングを試みた。驚いたことに、ウイロファージとプラシノウイルスの配列間で共有されるプロモーターシグナルを発見し、ウイロファージがイミタウイルス目以外のNCVに依存できることを示唆した52。われわれの発見は、真核生物のゲノムに広く存在することが最近発見されたPLVが、非常に多様性に富んでいることを明らかにした34,57。我々のデータセット(1,678配列)においてPLVが際立って多いことから、これは南極特有のものなのか、それとも淡水環境57で発見されたように海洋でより広く見られるものなのかという疑問が生じる。我々は154個のPgVV-cladePLVs34を発見したが、既知の1つの分離株(Gezel-14T51)はウイロファージのような生活様式を示した。これらのPLVは、NCV初期転写プロモーターモチーフと一致する割合が最も高く、Gezel-14Tと同様に、NCVに依存している可能性が示唆された。Gezel-14Tに関連する5つの配列が南極のビロームサンプルから以前に報告されているが27、今回の研究により、南極のPLVの既知の多様性はPgVVグループ以外にも大きく広がった。さらに、360のPLVがTsVグループに属し、その中にはNCVとの共感染を必要としないPLV Tetraselmis viridis virus S1が含まれていた62。注目すべきは、ほとんどのPLV(1387個)がグループX34に属するものと関連していたことである。グループX34は3つのMCPクレードを形成しており、その多くは重複したMCPと3重のMCPを持つ1つのウイルスを表していた。グループXのMCP間の乖離が大きいことから、これは早期の進化事象であることが示唆され、より密接に関連した3倍体を持つ傾向があるグループTsVの3倍体とは対照的である。まとめると、これらの発見は、PLVが南極の真核生物に感染する活発で多様なウイルス群であることを描き出している。
本研究のもう一つのハイライトは、宿主とウイルスの複雑な関係に対する洞察が深まったことである。NCVは優勢な真核生物ウイルスであり、そのほとんどがAllo-、Meso-、Schizomimiviridae科、およびAlgavirales目に属していた。これらのNCVの流行と時間的動態は、南極の植物プランクトンの個体群動態に影響を与えるNCVの積極的な役割を補強している24,26。実際、プラシノウイルスの中には、全ての分離株がマミエラ目64の植物プランクトンに感染することが知られており、宿主との安定した共存を維持できるものもある65。テチスウイルス属のPgV様ウイルスは、南極ウイルス群集の重要なメンバーであることが以前に同定されている27,66。我々の研究は、宿主であるアンタークティカ(P. antarctica)の開花減少に影響を与える(還元的制御)PgVの役割を時間的に明らかにするものであり、ウイルス溶解がこの南極の植物プランクトンの主要な死亡要因であるという最近の知見と一致する24。12月のP. antarcticaのブルーム終期におけるPgV様ウイルスの急増は、ガンマプロテオバクテリアの増加と対応していた。この細菌群は、Phaeocystisのウイルス感染に素早く反応することが報告されており67、微生物ループの燃料となるウイルス溶解の重要性を補強している。全体として、本研究は、調査地におけるバンフォビラ菌群の多様性を包括的に特徴づけるものである。この特徴づけは、既知のPLVとウイロファージの多様性を拡大し、Mriyaviricetes47という候補クラスに属するものとともに、新規のNCVの回収を含み、最近記載されたMirusviricota48という候補門のメンバーも同定した。
本研究の包括的な季節的カバレッジと強化されたサンプリング分解能は、サンプリングのタイミングがウイルス検出と発見の可能性に影響することを明らかにした。時間的なサンプリングは、異なるウイルス、すなわちNCV、ウイルスファージ、PLV、ファージの動態の理解を深めた。また、原核生物のバクテリオファージ-宿主間相互作用について、グループ特異的な応答とともに深い洞察が得られた。例えば、ガンマプロテオバクテリアは典型的な捕食者-被食者関係を示し、海氷が少ない時期には宿主とバクテリオファージの存在量が減少した。高いウイルス活性と低い宿主数によって特徴づけられるこのパターンは、ウェッデル海の不凍海域におけるウイルス活性アッセイでも見られた22。このような観察結果は、南極半島周辺の不凍地帯の拡大と不凍期間の長期化をもたらしている地球温暖化の状況において重要な意味を持つ68。さらに、フラボバクテリアとそのバクテリオファージの動態が、特に1月の植物プランクトンの開花期(クラスターA)に密接に連関していることがわかった。フラボバクテリア属バクテリオファージの増加量はバクテリアのブルームと一致していたが、ガンマプロテオバクテリア属バクテリオファージはブルーム後に最も優勢となった(クラスターC)。このような継時的なパターンは、南極のフラボバクテリアがChl-a蛍光と関連し、多様な複合有機化合物を分解することで説明できる69,70 。フラボバクテリアは、ガンマプロテオバクテリアや アルファプロテオバクテリアのような他のバクテリアに、不安定な化合物を利用可能にする69。我々の研究では、アルファプロテオバクテリアとそのバクテリオファージは、低温と親和性のあるこのグループの性質と一致するように、季節の終わり(クラスターB)と開花前(クラスターD)の寒い時期に目立つようになった71。
初夏はウイルス群集にとって重要な転換期であり、微生物生産が始まるとバクテリオファージの生産量と存在量が増加する25。我々の分析によると、この時期はウイルス活性のかなりの部分を占める少数の優勢なバクテリオファージの出現によって特徴づけられる。同じ調査海域で、この時期にバクテリオファージの活動が顕著に増加したため、炭素の流れが高次栄養レベルではなく微生物ループへとシフトした25。同時に、バクテリアのブルーム中に温帯性バクテリオファージが明らかに活性化しており、これはリフュージウムから活性化へのダイナミクスを示しており72 、南極のプロファージ誘導に焦点を当てた先行研究と一致している22,23,25 。
本研究は、南極ウイルス群集の多様性と動態における強い季節変動を初めて報告した。また、ウイルスの多様性を系統学的に解析することで、これらの群集が別個のものであることが明らかになった。最後に、宿主群集の時分割サンプリングは、南極海洋ウイルスの季節性と存在量に光を当て、微生物宿主との関連におけるウイルスの多様性をより完全に理解するためのユニークな視点を提供する。
研究方法
調査地とサンプル採集
サンプルはRotheraTime-Series73(RaTS, 緯度67.572°S;経度68.231°W)のサイトのMarguerite湾の水深15mから採取した。南極におけるサンプリング条件は変動が激しく、必ずしもサンプリングに有利とは言えないが、それでも我々は2つの連続した生産的なシーズン(2018年2月から4月までと2018年11月から2019年2月までの7ヶ月の期間)にわたって24日間のサンプルを収集することができた。水柱の特性は、導電率、水温、深度、塩分、クロロフィル自家蛍光、光合成有効放射を測定するSeaBird SBE 19 + CTDを使用して特徴付けられた。混合層深度(MLD)は、表層に対して0.05 kgm-3の水密度差のある深度と定義した19。水試料は、ニスキン瓶で順次キャストすることによって採取した。これらのボトルは、(清潔なPCチューブを使用し)静かにサイフォンで吸い上げて、あらかじめ洗浄した20Lのポリカーボネート製カーボーイに入れた。サンプリングに使用したすべてのカーボーイとチューブは、Contrad 70™ 2%v/vで洗浄した後、MilliQ超純水(UP)で除染した。サンプル採取の前に、カーボーイをサンプル水で3回洗浄した。カーボーイは不透明な袋で直射日光から保護した。サンプリングは朝の9:30~11:00に行った。サンプルはサンプリング開始から4時間以内に処理された。ラボはその場の温度(最低0.1 °C)に保たれ、必要に応じてサンプルは氷上で保管された。
溶存無機栄養塩のサブサンプリングでは、海水を孔径0.2μmのSuporメンブレンAcrodisc®フィルター(Pall, Port Washington, NY 11050, USA)でろ過し、3回サンプル洗浄した高密度ポリエチレン製ポニーバイアル(PerkinElmer, USA)に採取した。溶存無機窒素とリンのサブサンプルは分析まで-20℃で保存し、溶存無機ケイ酸のサンプルは4℃で暗所に保存した。クロロフィルa(Chl-a)のサンプルは、1~8.5Lの未濾過(全Chl-a)および20 µm逆篩(<20 µm画分)をGF/Fフィルター(Whatman, UK)で濾過して採取した。微生物量については、海水1mLをグルタルアルデヒドで0.5%v/v終濃度(25%、EMグレード、Sigma Aldrich、米国)で1℃(暗所)で30分間固定した後、液体窒素で瞬間凍結し、NIOZ研究室(オランダ)で分析するまで-80℃で保存した。植物プランクトン細胞は、Rotheraラボに到着後、新鮮なサンプル(氷上に保存)を直接カウントした。
ゲノム試料を取り扱う前に、すべてのベンチ表面をContrad 70™ 2% v/v (Decon Labs, East Sussex, UK)で洗浄し、UP水でリンスした。細胞画分メタゲノム・サンプルは、0.22 µm Sterivex™(MilliporeSigma, Massachusetts, U.S.)で全水3~15 L(ろ過時間1時間、in situ温度)をろ過して採取した。フィルターはパラフィルムで密封し、抽出まで-80℃で保存した。ウイルス画分のメタゲノム・サンプルは、Hurwitzら2013(文献74)に従って、鉄凝集法を用いて20 Lの海水から採取した。簡単に説明すると、0.22 µm以上の粒子は、A/Eグラスファイバーフィルター(142 mm, Whatman, GE Healthcare, UK)、0.22 µm PESフィルター(142 mm, MilliporeSigma, Massachusetts, US)を用いた2回の連続ろ過で除去した。ウイルスを1 mgL-1のFeCl3で凝集させ(1時間インキュベーション)、1 µm PCフィルター(142 mm, Whatman, GE Healthcare, UK)に回収した。フィルターは4℃、暗所で保存した。全サンプリング・メタデータは補足データ4に掲載されている。
微生物量、クロロフィルa、栄養塩濃度
ウイルスとバクテリアは、Brussaardら(2010、文献75)に従い、TEバッファー(pH8.2、文献76による。) TE-バッファーで希釈し、SYBRGreen-I(Sigma Aldrich, USA)で染色した後、励起波長488 nmの空冷アルゴンレーザーを装備したFACSCaliburフローサイトメーター(BD Biosciences, USA)を用いて、緑色蛍光をトリガーとしてサンプルを定量した(補足図10)。全植物プランクトン量は、卓上型FACS Celestaフローサイトメーター(BD Biosciences, USA)を用い、赤色クロロフィル自家蛍光をトリガーとして求めた77 。
クロロフィルa濃度(Chl-a)は、HPLCを用いて測定した(文献18による)。簡単に説明すると、フィルターを凍結乾燥し(48時間)、90%アセトンを用いて色素を抽出した(暗所4℃で48時間)78 。色素は、Van Heukelem and Thomas (2001)に従い、冷却オートサンプラー(4℃)を備えた粒径3.5μmのZorbax Eclipse XDB-C8カラムを備えた高速液体クロマトグラフィー(HPLC;Waters model 2690)で分離した。色素の検出と定量は、346 nm(Waters 996 HPLC Photodiode ArrayDetector)79 における DHI LAB 標準物質との比較に基づいて行った。
溶存無機大栄養素の濃度は、硝酸塩と亜硝酸塩についてはGrasshoffら(1983)、リン酸塩については MurphyとRiley(1962)、ケイ酸塩についてはStricklandとParsons(1968)に従い、TRAACS 800自動分析装置(Bran+Luebbe、ドイツ)を用いて求めた(文献80,81,82)。校正用標準試料は、試料と同程度の塩分濃度(35 ‰)の低栄養海水(LNSW)で希釈した。検出限界は、硝酸塩+亜硝酸塩が0.007 µM、亜硝酸塩が0.001 µM、リン酸塩が0.007 µM、ケイ酸塩が0.03 µMであった。
ウイルスおよび細胞画分のメタゲノム
細胞画分(Sterivexフィルター)のDNAは、Qiagen DNeasy Powersoilキット(Qiagen, Carlsbad, USA)を用いて、メーカーの指示に従って抽出した。Bead Ruptor Elite (Omni Internationals, USA)を用い、3.55 ms-1で30秒間滞留させながら2×10秒ビーズビートを行う前に、フィルターを開き、約3×3 mmの断片に切断した。ウイルス画分(鉄凝集法)のウイルスは、pH6.0のEDTA(0.1M)-MgCl2(0.2M)-アスコルビン酸(0.2M)緩衝液(サンプリングした海水1リットル当たり1mL)に4℃で一晩再懸濁した。再懸濁したサンプルを0.45 µm SFCAシリンジフィルター(Sartorius, Göttingen, Germany)で穏やかにろ過し、1 UµL-1のDNase I(Roche,Basel,Switzerland)で4℃で18時間処理した。DNase Iは、EDTAとEGTA(最終濃度0.1M)を加えて失活させた。ウイルスを100 kDa Amicon(MilliporeSigma、米国マサチューセッツ州)を用いて0.8~1 mLの容量に濃縮した。Wizard® PCR Preps DNA Purification kit (Promega, Wisconsin, United States)を用いて、製造者の指示に従ってDNAを抽出した。DNAは50μLの80℃分子グレードの低TEバッファー(pH8.0、10mM Tris、0.1mM EDTA)で2回溶出した。
TruSeq Nano DNA Kit(Illumina, San Diego, CA)を用いてライブラリーを調製し、IlluminaプラットフォームNovaSeq6000 S2(2 × 150 bp)を用いて、メーカーの指示に従って、サンプルあたり平均80 Mリード(58~123 M)でシーケンスした。リードの品質は、MultiQC v1.883 を用いて品質トリミングの前後で評価した。PhiXリードはbbduk v38.07(https://sourceforge.net/projects/bbmap/ )、低複雑度(dust filter threshold of 20)を用いて除去し、PCR重複はprinseq-lite v0.20.484を用いて除去した。イルミナアダプターはtrimomatic v0.3685で切り取った。ビロームの濃縮の程度を評価するために、すべてのメタゲノムにおいてViromeQC v1.0.1を用いて微生物遺伝マーカーの存在量を評価した86。
PhyloFlash v3.487を使用して、16/18S rRNA遺伝子のターゲットアセンブリーおよび分類による微生物群集の特徴付けを行った。プラスティド16S rRNA遺伝子にマップされたリードは除去された。
ウイルスゲノムのアセンブリー、分類、宿主予測
metaSpades v3.14.188 を用いて、ウイルス画分メタゲノムから得られたすべてのリードをスキャフォールドにコアセンブルした。少なくとも1500 bpの長さのスキャフォールドは、PPR-Meta v1.189を用いてウイルスシグナルをチェックした。ウイルスと同定されたが、CheckV v0.7.0ウイルス特徴遺伝子および細胞特徴遺伝子31を持たず、Cenote-Taker291によって非ウイルスと分類された配列は除去された。残りの共集合スキャフォールドは、配列の85%以上を95%の同一性でクラスタリングした結果8、配列のわずか0.039%しかクラスタリングされなかったので、ウイルス種レベルの運用分類単位(vOTUS)に相当する。
Rotheraのウイルス配列とGlobal OceanVirome8およびSouthern Ocean Virome29のデータセットとの重複を定量化するために、all versus all blastnを行った。
5000bpより長いウイルス配列、または完全性が70%以上のウイルス配列(CheckV completeness)については、prodigal92(v2.6.3 -p meta)を用いてコーディング領域を予測した。ウイルス配列は、原核生物ウイルスのRefSeq(-db ProkaryoticViralRefSeq94-Merged)と原生生物DNAウイルスのカスタムコレクション(補足データ5)を用いて、vContact293を用いてコーディング領域に基づいてクラスタ化した。クラスターはCytoscape v3.8.2を用いて灌流力指向レイアウト94で可視化し、足場となるウイルスの分類を重ね合わせた。以下のセクションでは、Crassvirales、Nucleocytoviricota、Preplasmiviricota(PLVsとvirophage)の標的同定について詳述し、その他のウイルス配列についてはCenote-taker2分類法を用いた。Caudoviricetes(UroviricotaPhylumの1クラス)、Nucleocytoviricota、Preplasmiviricota、および古細菌ウイルスのグループは手動で定義した(補足図11)。上記の定義されたグループ内の未知の配列は、グループの門ランク分類学に帰属した。Cenote-taker2によってCaudoviricetesとアノテーションされたスキャフォールドと、Caudoviricetesメガクラスター内のすべての配列(古細菌グループを除く)は、PhaGCN232を用いてファミリーランク分類学にさらに分類された。cenote-takerでハロウイルスと分類された古細菌グループの配列は、Thumleimaviralesに分類された。Crassvirales,Nucleocytoviricota , Maveriviricetes(virophage)およびPolintoviricetes(polinton-like viruses)の配列については、標的同定と分類学的分類を行った(以下のセクションを参照)。
宿主属は、iPHoP v0.938を用い、属ランク予測では標準カットオフ、クラスおよび門ランク予測では0.2偽発見率カットオフで、高品質および中品質のバクテリオファージ配列(10kbより長いか、少なくとも70%完全)について予測した(All_combined_scores.csvを使用)。矛盾する宿主予測は削除された。標準的な属レベルの出力では744の予測が得られ、低い予測しきい値ではクラスレベルで1668の予測が得られました。
真核生物ウイルスとして分類されたものを除くすべてのウイルス配列は、リソジニー遺伝子インテグラーゼ、エキソジナーゼ、およびバクテリオファージリプレッサータンパク質の存在について検査された。コード領域はprodigal92(v2.6.3 -p meta)を用いて予測され、hmmsearch(e-value 1e-5, HMMER v3.1b2)によってPFAM(34.0)、KO(97.0)、ncbi COGs(COGS2020)のHMMプロファイルと、diamond search(e-value 1e-10, v0.9.22)によってnrNCBI(2022年3月にダウンロード)とマッチした。インテグラーゼについては、K03733, K14059, K04763, K21039, COG0582, COG1518, PF00589, PF13495, PF00665, PF13683, PF13102, PF18697, PF09003, PF02899, PF12835, PF02022, PF14659との一致を考慮した、 PF18644、PF13976、PF13333、PF14882、PF12834、PF17921、および "CRISPR "と "Transposase "の文字列を含むものを除いたダイアモンドトップヒットに "integrase "の文字列を含むもの。excisionase については、PF06806、PF0782、およびダイアモンドトップヒットに "excisionase "という文字列を含むものにマッチするものとした。ファージリプレッサータンパク質については、PF00717, K22300, K07727, K18830, COG2932にマッチすると考えられた。
ウイルスおよび細胞メタゲノムからのリードは、bwa v0.7.17mem95 を用いてすべてのスキャフォールドにマップされた。リード長の80%以上の同一性が95%未満でマップされたリードはCoverM v0.6.196で除外し、samtools coverage v1.1197で各スカフォールドにマップされたリード数を計算した。スキャフォールドの水平カバレッジが70%未満の場合、そのアバンダンスは0に設定された。非ウイルス汚染の影響を除去するために、リードカウントを各サンプルのウイルスリードの総数で割って相対アバンダンスを計算した。深さ補正したスキャフォールドの垂直カバレッジは、相対リード量をスキャフォールドの全長で割って、ウイルスリードの平均塩基数をかけて計算した。リードアバンダンスは、アセンブリーゲノムの断片化がアバンダンスに影響する可能性がある場合、例えば、より高い分類レベルの組成アバンダンスに使用した。垂直カバレッジは、スカフォールドアバンダンス、単一遺伝子を含むスカフォールドの累積アバンダンス、NCVゲノムのビン化など、ゲノムの断片化が問題にならないと予想される場合に使用した。
南極のクラスウイルス属バクテリオファージ
Crassviralesのスキャフォールドを同定するために、Crassviralesは代替遺伝暗号を含むことが知られているので、タンパク質の予測に依存しない標的アプローチを用いた44 。まず、transeq98を用いてDNAスキャフォールドの6フレーム翻訳を得た(オプション:-frame 6 -table 11 -clean)。主要カプシドタンパク質(MCP)、ターミナーゼラージサブユニット(TerL)、ポータルタンパク質(portal)を含むCrassvirales系統樹マーカー遺伝子のHMMプロファイル(文献44参照)を用いて、hmmscan(HMMER v3.1b2)でホモログを検索した。Hmmscanの結果はフィルターにかけられた(e-value < 0.05, coverage > 0.3)。長さが10kbを超え、これら3つのタンパク質のいずれかと一致するスキャフォールドは、クラッスビラレス候補(n= 466)としてさらなる検査のために提出された。
候補となったCrassviralesのスキャフォールドをCaudoviricetesファミリーの大きな文脈の中で位置づけるために、International Committee on Taxonomy of Viruses (VMR_21-221122_MSL37)のVirus Metadata Resourceを使用した。43のCaudoviricetes科から、i)Crassvirales目のメンバー(2023年2月)、ii)Helgolandviridae(n= 1)、Graaviviridae(n= 2)、Duneviridae(n= 6)の分離株のうち、我々のアプローチでは配列が抽出できなかったものを除いて、それぞれ10株(10株未満の場合はすべて)を無作為に選択した。この結果、NCBI Nucleotideデータベースからゲノム、コードされたタンパク質、遺伝子アノテーションを得た245種/分離株が得られた。
系統を再構築するために、grepとseqtk subseq(https://github.com/lh3/seqtk)を用いて、ヘッダーに "terminase small"、"major head"、"major capsid"、"portal "を除く "terminase "を含むタンパク質を抽出し、参照ゲノムにコードされているTerL、MCP、portalタンパク質を検索した。ほとんどの配列から系統学的マーカーを抽出することができ(245のゲノムから243のTerL(99.2%)、234のMCP(95.5%)、185のポータル(75.5%)タンパク質)、遺伝子の重複は検出されなかった。さらに、673のCrassviralesゲノムとTerL、MCP、ポータルタンパク質の配列を収集した(文献43,44 )。これらの配列は、我々の候補Crassviralesの配列とともに、各タンパク質の別々の系統樹を構築するために使用した。多重配列アライメントにはMAFFT99 (v7.475, option: -auto)、アミノ酸置換モデルを決定するmodeltest-ng100 (option: -d aa)、系統樹を計算するIQ-TREE2 v2.1.1101(option: -m LG + G4 + F -B 1000)を使用した。ICTVで承認されたCrassviralesファミリーが形成するクレードに含まれる3つのタンパク質(TerL、MCP、Portal)がすべて含まれるCrassviralesスキャフォールド候補をCrassvirales配列とみなした。
候補スキャフォールドのORFは、停止コドンの再割り当てを考慮する3つのモード(オプション:標準、-TGA W、-TAG Q)を使用して、Prodigal v2.6.392で検出された。これらは、Yutin et al. 2021 (ref.44)のマーカータンパク質HMMを用いて機能アノテーションされた。ツリーとそのアノテーションは、ソフトウェアスイートggtree v3.6.2102とiTOL v5103を用いて作成した。ゲノムマップはgggenomes v0.9.5.9104を用いて作成した。
ヌクレオサイトウィルコータとミルスウィルコータ
NCVを同定するために、まず、vRhyme v1.1.0を用いてウイルス画分共アセンブルを行い、CONCOCT v1.1.0を用いて対応する細胞画分アセンブルを行い、アセンブルされたすべてのスキャフォールドをビニングした。スカフォールドは、ncldv_markersearch46を使用して、9つの巨大ウイルスのオーソロググループHMMプロファイルに対して、プロディガル予測タンパク質92(v2.6.3 -p meta)のhmmsearchを実行することにより、Nucleocytoviricotaマーカーを調べた。系統学的マーカー遺伝子へのヒットを含むすべてのビンをさらに調査した。ビンはviralrecall105を用いて、汚染している可能性の高い細胞足場から除染した(文献106のようにスコア<0のものを除去)。Karkiら2024(文献107)によって収集されたNCV、Mirusviricota、Herpesvirales、Eukaryotic、Archaealゲノムの包括的なセット(最近記載されたNCVクラスMriyaviricetes47を含む)とビンを組み合わせることによって、マーカーの別々の系統樹を構築した。さらに、RNAポリメラーゼ、DNAトポイソメラーゼI、DNAポリメラーゼBの真核生物クレードに属するマーカーを含むスキャフォールドを取り除いた。
系統樹は、このビンと、以前のメタゲノム調査46,47,48,106,108から収集したNCV単離株とメタゲノミックビンを含む参照セット、および2022年9月現在のRefSeq NCV単離株の追加分について構築した(補足データ2 )。まず、ncldv_markersearchを用いて7つの遺伝子マーカー46(VLTF3、A32、TopoII、TFIIB、PolB、RNAPL、SFII)を検出し、アライメントした。アラインメントは、BMGE v1.12111を使用して、配列の20%以上にギャップがあり、エントロピースコアが0.55以下の領域をトリミングした。このアラインメントは、IQ-tree2101の最良モデル探索オプション(-m MFP)を使用し、1000反復の超高速ブートストラップで最尤樹を構築するために使用された。ビンは、参照セットの分類学に基づいて分類学を手動で割り当てた。
ただし、Mirusviricota48と Mriyaviricetes47に分類されたものについては、少なくとも2つのマーカーを持つすべてのビンを保持した(遺伝子の有無については補足データ2を参照)。Mriyavirusesの配列は、真核生物様RNAポリメラーゼ、DNAトポイソメラーゼII、DNAポリメラーゼB遺伝子も含む大きなゲノムビンに属していた。マーカー遺伝子VLTF3、A32、MCP47を含むコンティグのみを残すことにより、この真核生物宿主のコンタミネーションを除去した。SFII、VLTF3、A32、PolB遺伝子の重複が1つ以上あるビンは、株の異質性が高いビンを避けるために削除した(文献106による)。平均ヌクレオチド同一性95%またはマーカー遺伝子アミノ酸同一性100%のビンをクラスタリングして冗長なビンを除去し、最良の代表(最も多くのマーカー遺伝子または最も高いN50)を選択した。真核生物のコンタミネーションは、MetaEuk v6.a5d39d9109を使用して、ORFを予測(Pfamリファレンスを使用)および分類(MMETSP_zenodo_3247846_uniclust90_2018を使用)することにより、NCVビンおよびフィルタリングされていないMriyavirus上で同定した。
ncldv_markersearchを使用して、7つの遺伝マーカー46 の最終的なビンセットをスクリーニングし、アラインメントと連結を実行した。アライメントは、BMGE v1.12110を使用して、配列の20%以上がギャップを持っており、エントロピースコアが0.55以下の領域をトリミングした。トリミングされたアライメントは、iqtree2101の最良モデルファインダーオプション(-m MFP)を用い、1000反復の超高速ブートストラップで最尤木を構築するために用いられた。最良適合モデルはLG + F + R10であった。ツリーはFigTree v1.4.4111で可視化した。
マーベリウイルスとポリントンウイルス
すべてのスキャフォールドは、グローバルおよびクレードに制限されたタンパク質アラインメントを使用して構築されたコレクションHMMを使用して、ウイロファージ(クラスMaveriviricetes )およびポリントン様ウイルス(PLVs、クラスPolintonviricetes )の主要キャプシドタンパク質(MCP)について検査された。Rothera scaffolds ORFを予測し、prodigal92 (v2.6.3 -p meta)を用いてアミノ酸に翻訳した。
Maveriviricetes については、非冗長な単離株およびメタゲノム MCP 配列のコレクション52 を使用した。グローバルおよびファミリーランクのMCPアラインメントはMAFFT99 (v7.407, -auto)で、HMMプロファイルはhmmbuild112 2 (HMMER v3.1b2)で構築した。これらのプロファイルを用いて、hmmsearch (HMMER v3.1b2)を用いて、Rothera scaffoldのアミノ酸配列(> 200 aa)から推定上のvirophage MCPを同定した。新しい推定ウイロファージMCPは参照配列と結合され、Maveriviricetes系統樹が構築され、配列は新しく提案された分類法(ref.52)に従って分類された。
PLVについては、キュレーションされたPLV配列のコレクションからMCP遺伝子を用いてHMMプロファイルを構築した34,57 。Yutin et al., 2015 (ref.34)で同定されたPLV MCPは、非冗長NCBIタンパク質データベースを検索するためのクエリーとして使用された。ヒットを収集し、類似度閾値0.5でUCLUST113を用いてクラスタ化し、Wolfら, 2018 (ref.114)に記載されたアプローチを用いて繰り返しアラインメントとクラスタ化を行った。クエリタンパク質を含むクラスターのアラインメントから、FastTree115 を用いてツリーを構築した。ツリートポロジーから8つのクレードが手動で推測され、それに対して別々のHMMプロファイルが構築された。翻訳されたRotheraのスキャフォールドを、これらのHMMプロファイルとBellas and Sommaruga, 2021 (ref.57)によって提供されたプロファイルを用いて検索した。ヒットしたタンパク質は、参照PLV MCP(HMMプロファイルのタンパク質)と混合した。得られたタンパク質セットは、上記のアプローチで繰り返しアラインメントとクラスタリングを行い、参照PLV MCPを含むタンパク質クラスターのアラインメントを使用して、FastTreeを使用してツリーを構築した。ツリーのクレードは、Yutin et al., 2015 および Bellas and Sommaruga, 2021 (refs.34,57)で定義されたクレードに従って命名した。
他のvirophage遺伝子の機能アノテーションのために、推定virophageスキャフォールドから予測されたすべてのタンパク質は、Rouxら2023(参考文献52)から入手可能なvirophageゲノムから予測されたタンパク質とプールされた。タンパク質はmmseqs easy-cluster116を用いてクラスタ化し、各クラスタについて、MAFFT99(v7.505, - einsi)、hhconsensus117(v3.3.0)、最後にhhmake117(v3.3.0)を用いてアラインメントとプロファイルを作成した。次に、hhsearch117 (v3.3.0, -E 1e-4)を用いて、すべてのプロファイルをPfam(http://pfam.xfam.org/)とPDB(https://www.rcsb.org/)のデータベースと検索した。少なくとも90%の確率で一致し、e値が1e-4以下で、明確な機能注釈があり、クラスターごとのベストスコアの90%以上のスコアを持つものがアノテーションに使用された。PLVスキャフォールドのアノテーションはウイルスファージと同様に行われ、推定PLVスキャフォールドから予測されたすべてのタンパク質は、利用可能なPLVゲノム34,57から予測されたタンパク質とプールされた。さらに、Bellas and Sommaruga 2021(参考文献57)のクラスターのプロファイルと、転送されたアノテーションからなるデータベースに対してプロファイルを検索した。注釈付きゲノムは、gggenomes104 とggtree102 を組み合わせて可視化した。
すべてのNCVビンについて、予測タンパク質をHMMER v3.3.2を用いてGVDBデータベースと検索した。Cafeteria roenbergensisウイルス「後期」遺伝子に相同な遺伝子の上流領域(50 bp)をゲノムから抽出し、meme-suite v5.5.0のstremeツールと陰性対照としてタンパク質コード領域を用いて濃縮モチーフを検索した。候補モチーフは、非ATコンセンサス部位と1e-3以下のスコアでフィルタリングした。同様に、すべてのウイルスファージ遺伝子の上流領域を抽出し、meme-suiteのseaツール(--thresh 1)を用いて、これらの候補モチーフの濃縮出現を検索し、やはり陰性対照としてタンパク質コード領域を用いた。5,000bps以上のPLVスキャフォールドも同様に解析し、コンセンサス「初期」NCVプロモーターモチーフ(WWWWWTGWWWWWW)の出現について調べた。
ウイルスの多様性と環境パラメータとの相関
非常に断片化したゲノムを避けるため、高品質および中品質(10kbより長いか、少なくとも70%完全)のウイルス配列について多変量解析を行った。アバンダンスデートの組成的性質を考慮し、組成データ解析法を用いて解析を行った118 。ウイルスリード量は、microbiome Rパッケージv1.20.0(https://github.com/microbiome/microbiome)を用いて、配列長と中心対数比変換により正規化した。アルファ多様性の季節的動態は、hillR v0.5.1119を用いて、各日の種の豊富さ、シャノン多様性指数および逆シンプソン多様性指数を計算することで調べた。シンプソン偶有性は、逆シンプソン指数を種の豊富さで割って算出した。さらに、任意の時点でウイルスリードの0.5%以上を占めるウイルスカフォールドと定義される優勢ウイルスの数と存在量を追跡した(n= 203)。
hclust120(セントロイド法)を用いてAitchison距離に基づく階層クラスター分析を行い、Rのstatsパッケージを用いて正規化した存在量をヒートマップで可視化した。
微生物量とChl-a濃度は対数変換し、その他の環境メタデータは正規性を視覚的にチェックし、正規分布に最も近くなるようにzスコア化または対数変換した。一対のピアソン相関を計算し、共変が強い環境メタデータのペアから1つを取り除いた(r> 0.8)。どの変数の組み合わせがウイルス群集の変化と相関が高いかを調べるため、Adonis2(vegan v2.6-4)121 を用いて一般的な多変量回帰モデルをデータに当てはめた。変数は順次並べ替え、二乗和の大きい順にモデルに入力し、有意でない変数はモデルから除外した。Mantel.partial関数を用いて環境条件をコントロールしながら、Aitchison距離行列の部分マンテル検定を用いて、ファージと細菌群集の関連を検定した(ピアソン相関と999個の並べ替え、Vegan v2.6-4)。コントロール環境行列は、一般的な多変量回帰モデルに従って有意であった共変量でない変数のユークリッド距離として計算された。
報告概要
研究デザインに関する詳しい情報は、この記事にリンクされているNature Portfolio Reporting Summaryに掲載されている。