見出し画像

Timing the evolution of phosphorus-cycling enzymes through geological time using phylogenomics

s41467-024-47914-0.txt
下記の文章は論文のアブストラクトをChatGPTに解釈させたものであり、正確性は保証しません。

Q1 何に関する論文か、詳しく説明してください。

これらの論文は、それぞれ異なる学問分野における研究成果を報告していますが、共通して生物学と地球科学の領域に関連しています。

Letunic, I. & Bork, P.の論文は、"Interactive Tree Of Life (iTOL) v5: an online tool for phylogenetic tree display and annotation"というタイトルで、系統樹をオンラインで表示し、注釈を付けるためのツールであるiTOLのバージョン5について述べています。このツールは、遺伝的なデータに基づいて生物の進化的な関係を視覚化するために使われ、研究者がデータをアップロードし、カスタマイズ可能な系統樹を作成することができます。このバージョンでは、パフォーマンスの向上やユーザビリティの改善がなされています。

Zhu, Q. et al.の論文は、"Phylogenomics of 10,575 genomes reveals evolutionary proximity between domains Bacteria and Archaea"と題されており、10575種のゲノムを用いた系統ゲノミクスの研究です。この研究では、バクテリアとアーキアのドメイン間の進化的な近さを明らかにしており、生命の進化に関する新たな洞察を提供しています。

Katoh, K. & Standley, D. M.の論文は、"MAFFT multiple sequence alignment software version 7: Improvements in performance and usability"というタイトルで、多重配列アラインメントソフトウェアであるMAFFTのバージョン7について報告しています。このソフトウェアは配列データを整列させる際に広く用いられており、このバージョンでは性能の向上と使い勝手の改善が図られています。

Derry, L. A.の論文は、"Causes and consequences of mid-Proterozoic anoxia"というタイトルで、中太古代における無酸素状態の原因とその結果についての研究です。地球の歴史における酸素濃度の変動は、生命の進化に大きな影響を与えており、この論文ではその一時期に焦点を当てています。

これらの論文は、それぞれの分野での技術的な進歩や新たな発見を報告しており、生物学的な進化や地球の環境変化についての理解を深めることに貢献しています。

Q2 研究目的とその背景について、詳しく説明してください。

Guindon, S. et al.の論文では、最尤法に基づく系統樹推定のための新しいアルゴリズムと方法について取り組んでいます。PhyML 3.0というソフトウェアのパフォーマンスを評価し、系統樹解析の正確性と計算効率を向上させることが研究課題です。生命科学において、正確な系統樹の構築は、進化の過程を理解する上で不可欠であり、この論文は計算ツールの改善を通じて、その知識のギャップを埋めることを目指しています。

Zhu, Q. et al.の論文は、10,575種のゲノムデータを用いた大規模な系統発生学的解析により、バクテリアとアーキアの進化的近接性を明らかにしようとする研究です。これまでの知識では、バクテリアとアーキアは生命の木の中で別々のドメインとされていましたが、この研究はそれらの間の進化的関係を再評価し、生命の起源や進化の理解を深めることを目的としています。

Walton, C. R. et al.の論文は、初期地球におけるリンの可用性と生命の影響に焦点を当てた研究です。リンは生命にとって不可欠な元素であり、その地球化学的循環は生命の進化に密接に関連しています。この論文は、初期地球環境におけるリンの動態と生命の起源・進化に与えた影響を探ることで、地球科学と生命科学の交差点にある知識のギャップに対応しています。

Acker, M. et al.の論文では、海洋微生物によるホスホネートの生産とその潜在的な機能について調査しています。ホスホネートは、リンを含む化学物質であり、生物地球化学的サイクルにおいて重要な役割を果たす可能性があります。この研究は、海洋微生物が生産するホスホネートの新たな源とその生態系内での役割を理解することで、生命科学における未解明の部分に光を当てています。

Ronquist, F. et al.の論文は、ベイジアン系統樹推定のためのソフトウェアであるMrBayes 3.2の効率とモデル選択機能の向上に関する研究です。ベイジアン手法は、系統樹を推定する際の不確実性を定量化する強力な手段ですが、計算コストが高いという問題がありました。この論文は、モデル空間を効率的に探索する新しい方法を提案し、系統樹推定の精度と効率を改善することで、系統解析の技術的な課題に取り組んでいます。

Q3 本研究で用いた手法について、詳しく説明してください。

これらの研究論文は、系統学的解析とファイロジェノミクスに関する様々な方法論やツールを提供しています。それぞれの論文を具体的に見ていきましょう。

  1. Lee, M. D.「GToTree: a user-friendly workflow for phylogenomics」では、GToTreeというユーザーフレンドリーなワークフローが紹介されています。このツールは、遺伝子の同定から系統樹の構築までのプロセスを自動化し、ファイロジェノミクスの分析を簡単にすることを目的としています。ユーザーは、特定の分類群に関連する遺伝子セットを選択し、これらの遺伝子を用いて複数のゲノムや遺伝子配列の比較を行い、系統樹を構築することができます。これにより、生物間の進化的関係を明らかにすることができます。

  2. Guindon, S. et al.「New algorithms and methods to estimate maximum-likelihood phylogenies」では、PhyML 3.0というソフトウェアが紹介されています。このソフトウェアは、最尤法(maximum-likelihood)を用いて系統樹を推定するための新しいアルゴリズムと方法を提供します。最尤法は、与えられたデータに最も適合する系統樹を見つける統計的手法であり、進化的イベントの確率モデルに基づいています。PhyML 3.0は、計算効率と推定精度の向上を目指しており、多様な進化モデルや計算オプションを提供しています。

  3. Letunic, I. & Bork, P.「Interactive Tree Of Life (iTOL) v5」では、オンラインで系統樹を表示し注釈を付けるためのツール、iTOL v5が紹介されています。このツールは、系統樹の可視化とカスタマイズを可能にし、研究者が系統樹に色分け、ラベル、図形などを追加して、情報を豊かに表現することができます。これにより、系統樹の解釈や発表が容易になります。

  4. Eddy, S. R.「Accelerated Profile HMM Searches」では、高速なプロファイル隠れマルコフモデル(HMM)検索を可能にする技術が紹介されています。プロファイルHMMは、配列のファミリーに特有の統計的パターンを捉えるためのツールであり、この技術を用いることで、大規模なデータベースに対する配列検索が高速化されます。これにより、新しい遺伝子やタンパク質の同定が効率的に行えるようになります。

  5. Edgar, R. C.「Muscle5: High-accuracy alignment ensembles enable unbiased assessments of sequence homology and phylogeny」では、Muscle5という配列アラインメントツールが紹介されています。このツールは、高精度なアラインメントアンサンブルを生成し、配列の相同性や系統関係の評価を偏りなく行うことを可能にします。正確な配列アラインメントは、系統樹の構築や進化的研究において重要な前提条件です。

これらの手法やツールは、生物の進化的関係を解明するための科学的な問いに対して、データの収集、解析、表示の各段階で用いられます。具体的には、遺伝子やタンパク質の配列データを収集し、それらを比較・アラインメントして系統樹を推定し、最後にその系統樹を可視化して研究結果を共有・検証するプロセスにおいて活用されます。

Q4 本研究の成果と限界について、詳しく説明してください。

申し訳ありませんが、提供されたコンテキストからは、特定の論文の詳細な研究成果や制約、課題を特定することはできません。ただし、一般的な知識に基づいて、それぞれの論文の概要とそれが科学コミュニティに与える影響、および研究の限界点について説明します。

  1. Zhu, Q. et al. (2019) の論文では、10,575のゲノムを用いた系統ゲノミクスの研究を通じて、細菌(Bacteria)と古細菌(Archaea)の進化的な接近性が示されています。この研究は、生命の進化の歴史を解明する上で重要な成果をもたらしていますが、ゲノムデータの解釈や系統樹の構築方法には依然として議論の余地があります。科学コミュニティには、生命の起源や進化の理解を深める新たな視点を提供する可能性がありますが、使用されたデータや分析手法のバイアス、さらにはまだ発見されていない種の存在などが研究の限界点となり得ます。

  2. Derry, L. A. (2015) の論文では、中原生代における無酸素状態(anoxia)の原因とその結果について議論されています。この時期の地球の酸素レベルは生物多様性や進化に重要な役割を果たしており、その理解は地球科学や古生物学における重要な問題です。研究の成果はこれらの分野に影響を与える可能性がありますが、地質学的記録の不完全性や解釈における不確実性が主な限界点です。

  3. Mateos, K. et al. (2023) の論文では、硫黄循環酵素の進化と分布が初期地球の酸化還元状態を反映していると報告されています。この研究は、地球の生化学的サイクルと生命の進化を結びつける新たな知見を提供しており、生命起源や地球環境の変遷に関する研究に貢献する可能性があります。しかし、古代酵素の機能再現や古代環境の正確な再構築は困難であり、これが研究の限界点となるでしょう。

  4. Guindon, S. et al. (2010) の論文では、最尤法に基づく系統樹推定のための新しいアルゴリズムと方法が提案され、PhyML 3.0の性能が評価されています。このツールは系統学研究における計算効率と正確性を向上させることを目指していますが、計算アルゴリズムの最適化や多様なデータセットに対する適用性は常に挑戦的な課題です。この研究は分子系統学や進化生物学の分野における分析手法の発展に寄与する可能性がありますが、計算リソースの要求や複雑なモデルの選択が制約となり得ます。

これらの論文の成果はいずれも、関連する科学分野に新たな知識や手法を提供し、今後の研究方向性に影響を与える可能性があります。それぞれの研究は、利用可能なデータ、分析手法、そして科学的理解の範囲内での制約に直面していますが、これらの課題を克服することで、さらなる発展が期待されます。

Q5 本研究で何を明らかにしたか、詳しく説明してください。

この学術論文の結論部分は、古代のリンの生物学的利用可能性とリン酸塩の濃度に関する系統発生学的分析の知見を提供しています。アーキアン代とプロトロゾイク代を通じてのリン酸塩の濃度と代替リン種の起源に関する初めての推定を行い、微生物コミュニティ周辺の先カンブリア時代のリン酸塩濃度を独立したアプローチで推定しています。これらの結果は、アーキアン代の大部分において現代生物の祖先がリン酸塩やヒポリン酸塩を広範囲に利用していなかったこと、そしてリン酸塩の利用はメソアーキアン代に遡るものの、GOE(大気酸素増加イベント)の後により広範囲で使われるようになったことを示唆しています。これは生物多様性の増加と競争の激化に関連している可能性があります。

また、リン酸塩の濃度に関する既存の地球化学的推定値との矛盾を解決し、先カンブリア時代のリン酸塩貯蔵量に関する議論を前進させます。溶解実験から推測されるリン酸塩豊富な状態は、パレオアーキアン代初期に低親和性リン酸塩取り込みメカニズムの出現と一致している可能性がありますが、アーキアン代の終わりからパレオプロトロゾイク代にかけてリン酸塩が枯渇していったとする他の説が、この時期に出現した多様なリン酸塩代謝経路と潜在的に高親和性のリン酸塩トランスポーターによって支持されています。したがって、リン酸塩の制限がGOEのタイミングを制御する重要な要因であった可能性があります。

アーキアン代にはリン酸塩を取り込むことができる多くの微生物種が存在しましたが、還元リン化合物を利用できる種は少なかったことが、図3と補足図15および16のイベントの相対的な希少性によって示されています。これはネオアーキアン代からパレオプロトロゾイク代の境界で変化し、系統発生学的証拠がリン酸塩(ptxD経由)と多様なリン酸塩分子(phnZ、おそらくphnJやphnM経由)の同化のためのゲノムメカニズムのより広範な普及を指摘しています。GOE後のリンプールの拡大は、成長する生物圏の結果である可能性があります。

リン酸塩の生物学的生産の進化と、パレオプロトロゾイク代におけるppdの出現は、より混雑した微生物の生息地の結果かもしれません。リン酸塩はリン酸塩とカルボン酸の官能基の代謝経路における競争阻害剤として機能し、他の微生物の成長を妨げることができます。安定したC-P結合のためにリン酸エステルよりも分解に耐性があり、海洋微生物がウイルス感染や捕食から身を守るためにこれらを産生するという仮説があります。リン酸塩の生物学的生産は、私たちのデータによるとリン酸塩の利用の後に出現したようですが、これは初期アーキアン代に広く普及していなかった絶滅したリン酸塩生成経路を示している可能性があります。あるいは、リン酸塩と有機物の存在下で変成岩や熱水環境において無機的に微量のリン酸塩が生成された可能性もありますが、これについての実験的証拠はまだありません。いずれにせよ、私たちの結果は、メソアーキアン代からパレオプロトロゾイク代に起源を持つ生物学的リン酸塩分解経路の放散を明確に示しており、このシグナルが現代の生物に保存されていることは、その時代におけるこの代謝経路の重要性を物語っています。

HMMER3を使用して、リン酸塩、リン酸塩、ヒポリン酸塩の分解、輸送、生産に関わる鍵となる経路の遺伝子のホモログを私たちの分子時計ゲノムタクサで検索しました。これには、NCBIの原核生物ゲノム注釈パイプラインからダウンロードしたHMMプロファイルと、e値の閾値0.1を使用しました。利用可能でない場合(例えば、リン酸塩やヒポリン酸塩の輸送と酸化に関連するタンパク質の場合)、同じe値の閾値を使用して、実験的に特徴づけられたタンパク質から構築されたカスタムHMMプロファイルを使用して検索が行われました。

得られたヒットは、MAFFT v.7.497を使用して整列され、次にE-large-INS-1を使用して整列されました。次に、trimAl v1.2rev59を使用して85%以上のギャップを含む位置をトリミングしました。このカットオフは、あまり積極的でないトリミングが確立された関係をよりよく回復することがわかったため選ばれました。次に、ModelFinderによって選ばれた置換モデルの下でIQ-TREE v.2.0.3を使用して最大尤度ツリーが生成されました。

得られたツリーには、TreeViewer v2.0.18の「Branch score」と「Propagate attribute」モジュールを使用してHMM検索からのビットスコアが注釈されました。ツリーの葉にビットスコア値を割り当てるだけでなく、内部ノードにも子孫の平均スコアに基づいてビットスコア値を割り当てました。TIGRFAMsのビットスコアの閾値をクリアしたホモログを表す葉も強調表示され、クエリシーケンスと同じ程度の類似性を持つクレードを区切る輪郭を描くことができました。クエリシーケンスを含む単系統クレードに属する葉と、それぞれのビットスコアの閾値をクリアした他の葉はさらなる分析のために保持され、残りは破棄されました。

先カンブリア時代の微生物コミュニティがリンによって制限されていた可能性がありますが、もしそうであれば、それは生物圏の成長と進化を制約したかもしれません。しかし、先カンブリア時代の海洋リン酸塩貯蔵量に関する地球化学的推定は、アーキアン代で0.12μM未満から4100μM、プロトロゾイク代の海洋で0.03から2.5μMの範囲に及びます。また、局所的なマイクロスケール環境が生命の起源に関連する化学経路を推進するために最大100mMのリン酸塩を達成した可能性があると提案されています。これらの違いは、サンプリング戦略や計算モデルの仮定の違いから生じています。したがって、アーキアン代とプロトロゾイク代における微生物に対するリンの利用可能性の程度は、特に直接的な制約が少ない表層水に関しては、依然として議論の対象です。

現代の微生物コミュニティは、環境からリンを供給するために多様な酵素を使用してリンの限られた利用可能性に対処しており、これには溶解性有機リン(DOP)化合物や無機リン種を含む総溶解性リン(TDP)が含まれます。これらにはリン酸塩およびリン酸エステル(Pが完全に酸化された状態のP(V))だけでなく、リン酸塩(P(III))、リン酸塩(おそらくP(III))、ヒポリン酸塩(P(I))のようなより還元された化合物があります。リン酸塩とヒポリン酸塩は、一部の生息地でDOPの最大26%を構成し、地球化学的推定によると、特にリン酸塩は隕石からの高い入力と地球のより還元された酸化還元状態によって古生代の海洋で顕著でした。さらに、リン酸塩は多くの微生物種のリンの源であり、場合によっては化学合成細菌の電子供与体として機能します。対照的に、リン酸塩は全体の高分子量DOPの約四分の一を構成しており、他の還元リン分子には存在しない特徴的な強い炭素-リン(C-P)結合を含んでいます。これらは、生命の木全体のさまざまな細菌および古細菌の分類群といくつかの異なる生息地で栄養資源として同化されます。重要なことに、ゲノム研究は、リン酸塩が枯渇した水域や土壌でリン酸塩分解経路がより一般的であることを発見しており、これはリン酸塩不足に対処するメカニズムを表している可能性があります。この観察は、これらの酵素の系統発生学的歴史が過去のリン酸塩の利用可能性を再構築するためのツールとして使用できることを示唆しています。

Q6 本研究で用いたデータセットを網羅的に列挙し、名前やURLなどがあればそれらも含めて詳しく説明してください。

この質問に対する答えは、提供された論文のコンテキストを元にすることができません。しかし、一般的な知識をもとに答えることは可能です。

まず、Guindon, S. et al. (2010)によるPhyML 3.0の評価については、この研究で使われたデータセットはおそらく公開されている系統樹推定に使われる標準的な配列データセットでしょう。PhyMLは系統樹推定ソフトウェアであり、その評価には多様なタクソンからの配列データが必要です。これらのデータセットは通常、公開データベースから入手可能で、例えばNCBIのGenBank(https://www.ncbi.nlm.nih.gov/genbank/)やEBIのENA(https://www.ebi.ac.uk/ena)からダウンロードできます。

次に、Parks, D. H. et al. (2020)による細菌と古細菌の完全なドメインから種までの分類学に関する研究では、おそらく大規模なゲノムデータセットが使用されています。これらのデータセットは、NCBIのGenome(https://www.ncbi.nlm.nih.gov/genome/)やJGIのIMG/M(https://img.jgi.doe.gov/cgi-bin/m/main.cgi)などのデータベースから取得できる可能性があります。

最後に、Lee, M. D. (2019)によるGToTreeについては、このツールはユーザーフレンドリーなファイロジェノミクスのワークフローを提供するもので、使用されるデータセットはユーザーが選択したゲノムデータに基づいています。GToTreeは特定の分類群に対してゲノムデータを集め、それを用いて系統樹を構築します。GToTreeは以下のURLからダウンロードできます:https://github.com/AstrobioMike/GToTree。

これらの論文の記述と私の知識には相違がありませんが、具体的なデータセットの名前やURLについては、各論文のサプリメンタリーデータやメソッドセクションを参照する必要があります。それらの情報は研究者が使用した特定のデータセットやその入手方法に関する詳細を提供するでしょう。

7 本研究を特徴づけるキーワードを日本語で提案し、ハッシュタグとして列挙してください。(5個程度)

#ベイジアン系統推定 #MrBayes #最尤系統樹推定 #PhyML #原核生物進化 #バクテリアとアーキアの進化的近接性 #プロテロゾイクの無酸素環境 #地球化学

この記事が気に入ったらサポートをしてみませんか?