50年来の難問に挑む、DeepMindのAlphaFoldというプロジェクトについて
(Photo by Sangharsh Lohakare on Unsplash)
ChatGPTをはじめとする、LLM系の話題にはテック系の仕事をしている身ながら正直ちょっとついていけてない。
その中で機械学習・AIに関して前々から注目しているのがDeepMindが研究を進めているAlphaFoldというプロジェクトだ。
先日そのAlphaFoldに関して最新のアップデートがあった。
このプロジェクトは生物学で50年以上に渡り進展のない難問、タンパク質の「フォールディング問題」に機械学習を用いて挑む、というとても興味深いプロジェクトなので今日はAlpahFoldについて紹介したいと思う。
タンパク質の「フォールディング問題」
生物学には分子という観点から生命現象を説明しようとする、分子生物学という分野がある。さらにこの分子生物学の中の一つの分野として、タンパク質や核酸の立体構造について研究する、構造生物学という分野がある。
分子生物学の初期の金字塔的な成果として、ワトソン&クリックによるDNAの発見があるが、このクリックが「遺伝情報はDNAからmRNAを経てタンパク質へと伝達される」という、セントラルドグマという概念を提唱して以来、構造生物学は飛躍的に発展してきた。
(セントラルドグマという単語を見るたびにエヴァンゲリオンを思い出してちょっとワクワクする。笑)
一般にタンパク質について知りたいのはそれが生体内でどういう役割を果たすか、ということであるが、それにはその立体構造が密接に関わる。
例えば酵素というタンパク質は特定の物質に対してのみ作用するが、それは鍵と鍵穴のように立体的な構造の組み合わせにより実現されることがわかっている。形さえ合えば金属であろうが蝋であろうが鍵を開けられるのと同じように、酵素が酵素としての役割を果たすのはその組成ではなく、単純にその形による、ということだ。
一方で、あるタンパク質の組成、つまり炭素や水素からなる分子式がわかったとしてもそこからどのように折り畳まれ(フォールディングという)、立体構造を作るのかを推定するのは非常に難しい。パーツだけあっても説明書がなければプラモデルは組み立てられない。この問題はタンパク質の「フォールディング問題」として長く研究されていたが、ごく最近まで50年近くにわたり大きな進展がなかった。
タンパク質の立体構造が推定できると、タンパク質を合成したときにそれが生体内でどういう反応を起こすか、というのが予測できる。
これを製薬に応用することで、新しい治療薬の開発に役立てることができる、というのがこの問題を解決することで期待されていることの一つである。
AlphaFoldが50年来の難問を解決する
DeepMindは世界一のプロ囲碁棋士を破ったAlphaGoで知られる、進展目覚ましい機械学習の分野のその中でトップに立つ企業であるが、最新の機械学習の研究成果をこの「フォールディング問題」に応用したのがAlphaFoldというプロジェクトである。
タンパク質の立体構造研究の成果を測るため、CASP (Critical Assessment of protein Structure Prediction)という立体構造を推定するコンテストが1994年以来、2年おきに開催されている。
2018年、それまでのは正答率は40%前後でほとんど進歩がなかった中、AlphaFoldは正答率60%を叩き出してトップに立つと、2020年には80%以上の正答率を出し、革新的な成果を出した。
昨年には現在知られているすべてのタンパク質についてその立体構造の推定を完了し、無料で利用できるデータベースとして研究者に公開している。
今回のアップデートでは漸進的な進化で、特別目立つものではなかったものの、昨年のデータベースの公開により、応用分野での研究が進んでいることが伺えた。
こうして科学の一分野のブレイクスルーが別の分野でのブレイクスルーを引き起こす様子を見ると、とてもワクワクする。AlphaFoldの動向については今後も注視していきたい。
生物学を専門で勉強したわけではないので間違っているところがあれば教えてください、というのと、もし詳しい方がいたらAlphaFoldが研究の現場に与えたインパクトだったり、実際に使った経験など非常に興味があるので教えていただけるととても嬉しいです。
この記事が気に入ったらサポートをしてみませんか?