見出し画像

Predicting metabolic fluxes from omics data via machine learning: Moving from knowledge-driven towards data-driven approaches

https://www.csbj.org/article/S2001-0370(23)00358-6/fulltext

  1. 本研究の背景と課題は、微生物の表現型(生物の形質や特性)を正確に予測することで、これはシステム生物学の主要な課題となっています。ゲノムスケールモデル(GEMs)は、代謝フラックス(生物が生存するために行う物質の移動や化学反応)を予測するためによく使われる数学的な手法です。しかし、これらのモデルの使用には、生物の代謝ネットワークの既知の知識と適切な目的関数(モデルの出力を最適化するための計算式)が必要で、これが異なる条件下での代謝フラックスの予測を困難にしています。

  2. 本研究の目的は、さまざまな条件下でのフラックスを予測する新しいアプローチを提供することです。また、独自性と創造性は、トランスクリプトミクス(遺伝情報をどのように解読して有用な物質を作り出すかを研究する分野)やプロテオミクス(タンパク質に関する全体像を理解しようとする分野)データを使用した教師あり機械学習(ML)モデルを用い、そのパフォーマンスを従来の手法と比較することにあります。

  3. 本研究の着想は、細菌の種類や代謝の条件を予測するための手法を改良し、予測精度を向上させるための以前の研究から来ています。また、本研究は、微生物の代謝を予測するための現行の手法とは異なる新しいアプローチを提供するものであり、これはコンピュータシミュレーションや機械学習という二つの計算フレームワークの統合を試みています。

  4. 本研究では、線形回帰、サポートベクターマシン、決定木、ランダムフォレスト、XGBoost、および人工ニューラルネットワークといった機械学習モデルを用いて、トランスクリプトミクスと/またはプロテオミクスデータを用いた代謝フラックスの予測を評価しました。さらに、これらのモデルの性能を従来の方法と比較することで、機械学習技術が代謝モデリングの問題に対処するための有望な手段であることを示しました。

  5. 本研究の有効性は、提案した機械学習モデルがpFBA(一種のゲノムスケールモデル)手法と比較して、より小さい予測誤差で内部および外部の代謝フラックスを予測できることを示すことで検証しました。

この記事が気に入ったらサポートをしてみませんか?