見出し画像

Predicting enzymatic function of protein sequences with attention

1 本研究の学術的背景,研究課題の核心をなす学術的「問い」は?
本研究の学術的背景は、プロテインの情報がますます増えているが、そのうちの一部しか人手で注釈付けされていないという問題です。具体的には、UniProtKBというデータベースのエントリーのうち、人間の注釈者によってレビューされたのはわずか0.25%に過ぎないということが示されています。このギャップを埋めるために、プロテインの配列から機能を推測する自動ツールの開発が求められています。
研究課題の核心は、トランスフォーマーと呼ばれるディープニューラルネットワークが、プロテインの配列情報に基づく酵素の機能予測にどれだけ有望かを調べることです。

2 本研究の目的及び学術的独自性と創造性は?
本研究の目的は、トランスフォーマーを用いたプロテインの機能予測モデルの性能を評価することです。具体的には、酵素コミッション(EC)番号の予測という特定のケースで、他の既存のツールよりも優れた性能を実現できるかどうかを検証します。
本研究の学術的独自性は、トランスフォーマーをプロテインの機能予測に適用するというアイデアにあります。これまでの研究では、プロテインの機能予測に対してはLSTM(長短期記憶)アーキテクチャが主に使用されてきましたが、トランスフォーマーはLSTMよりも長距離の相互作用を扱うのに優れているとされています。そのため、本研究はプロテインの機能予測におけるトランスフォーマーの有効性を示すことで、領域における新たなアプローチを提案しています。

3 本研究の着想に至った経緯や,関連する国内外の研究動向と本研究の位置づけは?
本研究の着想は、プロテインの配列情報におけるトランスフォーマーの潜在能力に関する先行研究から得られました。著名な研究者たちによる研究では、トランスフォーマーがプロテインの二次構造予測やタンパク質の局在予測などの課題において良い結果を示していることが示されています。
国内外の関連研究では、プロテインの機能予測においては主にアラインメント(配列の類似性を見つける手法)に基づく手法や機械学習アプローチが用いられてきました。また、LSTMを用いたモデルも一部で採用されてきましたが、長距離相互作用をうまく考慮することができていないとされています。
そこで、本研究ではトランスフォーマーを酵素の機能予測に適用することで、既存の手法よりも優れた性能が得られるかどうかを明らかにし、その有効性を評価します。

4 本研究で何をどのように,どこまで明らかにした?
本研究では、プロテインの機能予測におけるトランスフォーマーの性能を検証しました。具体的には、酵素コミッション(EC)番号の予測に焦点を当て、既存のモデルと比較して優れた結果を示すことを目指しました。
結果として、本研究のEnzBertトランスフォーマーモデルは、プロテインの配列情報だけを用いた単機能酵素クラスの予測において、最先端のツールを上回るパフォーマンスを発揮しました。具体的には、EC40ベンチマークにおけるEC番号レベル2の予測精度が84%から95%に向上しました。さらに、EC番号の最も詳細なレベルであるレベル4の予測品質を評価するために、ECPredやDeepECと比較するための2つの新しいベンチマークを作成しました。その結果、マクロF1スコアはそれぞれ41%から54%、20%から26%に向上しました。
また、本研究ではトランスフォーマーの解釈性方法として、単純なアテンションマップの組み合わせを使用することも示しました。アテンションマップによって特定の残基が重要であることが特定されることがあり、これは既知の触媒サイトに対応する傾向があることが示されました。

5 本研究の有効性はどのように検証した?
本研究では、トランスフォーマーを用いたプロテインの機能予測モデルの有効性を複数の実験によって検証しました。
まず、酵素コミッション(EC)番号の予測精度を他の既存のモデルと比較し、EnzBertトランスフォーマーモデルが優れた結果を示すことを確認しました。
また、アテンションマップを用いた解釈性の方法も評価しました。アテンションマップが既知の触媒サイトに対応する重要な残基を特定する傾向があることを示しました。
さらに、既存の解釈性の方法と比較してアテンションマップの優位性を定量的に評価しました。結果として、最大F-Gainスコアが96.05%となり、従来の解釈性方法が最大で91.44%に達するのに対して、アテンションマップが優れた性能を示したことを報告しました。これにより、解釈性の手法としてのアテンションマップの有効性を確認しました。

この記事が気に入ったらサポートをしてみませんか?