爆発的進歩!タンパク質の高次元構造の解析:2021年のブレイクスルー
タンパク質については栄養素として興味を持たれる方が多いかもしれませんが、ここでは分子レベルでのタンパク質の構造の世界を覗いてみたいと思います。
それはサイエンス誌が発表した、2021年のブレイクスルーに選ばれたという記事がきっかけでした。
2021 BREAKTHROUGH OF THE YEAR
Protein structures for all
AI-powered predictions show proteins finding their shapes BY ROBERT SERVICE 2021
AIを使うことで、タンパク質の三次元構造を予測するという研究が飛躍的に発達!という内容を紹介、解説したいと思います。
まずタンパク質の構造とは?
タンパク質は20種類のアミノ酸が異なる割合と配列で組み合された直鎖(ポリマー)です。その大きさは51個のアミノ酸からなる分子量5733のインスリンのような小さな物から、筋肉タンパク質の中には26,926個のアミノ酸からなる分子量299万のような巨大なものまであります。そのアミノ酸の配列を一次構造といいます。つまり、私たちのDNAにコード化された順序で各アミノ酸がつながれ直鎖状になるのです。リボソームと呼ばれる細胞内の工場で作られた後、その鎖がユニークで複雑な立体構造を持つタンパク質へと完成されます。その立体構造はアミノ酸の配列によって決まると考えられてきました。
タンパク質の立体構造が意味することは?
ヒトには何十万という種類のタンパク質が存在していて、生体内で多種多様な役割を担い生命には必須の分子です。筋肉を収縮させ、食物を細胞のエネルギーに変え、血液中の酸素を運搬し、微生物の侵入と戦うなどです。酵素もほとんどがタンパク質ですし、今、話題の抗体もタンパク質なのです。
それらタンパク質の三次元構造が、あるタンパク質が他の分子とどのように相互作用するかを決定し、細胞内でのタンパク質の役割、働きを決定しているのです。
酵素は生化学的反応の速度を爆発的に促進する触媒です。タンパク質である酵素はその三次元構造のなかに活性部位と呼ばれる特定部位があって、基質と呼ばれる反応物が結合して反応が引き起こされます。その活性部位はやはり三次元の形と構造によって決まり、特異性がとても高くひとつの酵素はある反応のみ触媒します。
大抵の酵素は熱や酸によって変性しその触媒能力が失われますが、それは三次元構造が破壊されたということなのです。
ブレイクスルーに選ばれたのはなぜか?
アメリカの生化学者Christian Anfinsen氏は、1972年のノーベル賞受賞スピーチで、ある構想を打ち出したそうです。いつか、タンパク質のアミノ酸配列(一次構造)から、その三次元構造を予測することができるようになるだろうとです。
50年近くの歳月を経て、研究者たちは人工知能(AI)駆動型ソフトウェアによって、何千ものタンパク質の正確な構造を解明できることを明らかにしたのです!この研究が2021年のSCIENCE誌のブレイクスルーに選ばれたのです。
アミノ酸の配列を含めたタンパク質の構造は、かつては実験室での骨の折れる分析によってのみ決めれらるものでした。たくさんのタンパク質が含まれている試料から、目的のタンパク質を大量に精製し分析しなければならないからです。また各タンパク質はその性質が違い扱い方も入念に調べなければなりません。お金も時間もかかる仕事だったのです。私もある酵素の研究を何年も行っていました。
そのような中でも、X線結晶解析などの手法によって実験的に解明された約185,000の立体構造が「タンパク質データバンク」に保管されています。
1970年代から、あるタンパク質がどのように高次構造を形成するか予測するコンピュータ・モデルの作成が始まったそうです。タンパク質のアミノ酸配列を与え、上記の実験的に解明されたデーターと比較しながら試行錯誤しながら進められていました。その後、AIを駆使したソフトウェアの開発によって、飛躍的に進化していったのです。2021年になって、まず数百のタンパク質の構造を解明したと報告されました。そしてさらに、人体に存在する35万個のタンパク質(既知のヒトタンパク質の44%)について、同じことを行ったという報告が続きました。今後数カ月で、データベースはすべての生物種で1億個に増え、それは存在すると考えられている総数のほぼ半分になると予想されています。
なんという量とスピードでしょう!
次のステップは、これらのタンパク質のうち、どのタンパク質が一緒に働き、どのように相互作用するかを予測することでした。すでに、4433個のタンパク質-タンパク質複合体が報告され、どのタンパク質がどのように結合しているかが明らかにされたそうです。さらに912の複合体も追加されています。
このような進歩によって、生物学や医学の分野で新しい発見、進歩が加速されるのは間違いないと思います!
更なる課題は、タンパク質が作用する時に生じる構造の微妙な変化をモデル化することだそうです。また、細胞内で無数の仕事をこなす巨大な多タンパク質複合体のすべてを解析することも今だに困難な作業です。しかし、昨年のAIによる爆発的な解析技術の進歩は、これまで見たこともないような生命のダンス、つまり生物学と医学を永遠に変えるようなパノラマを提供してくれるであろうと結論付けています。
実は、今回のこの記事を読んで、技術の進歩はもちろんですが、タンパク質の種類の多さ、複雑さを更に認識し、生命の複雑さ精巧さを想像し驚いています。このような研究が進むことで、人類の自身を含めた生命の凄さの理解がいっそう進むことを願っています!
参考)カラー図解 アメリカ版 新・大学生物学の教科書 第1巻
カラー図解 アメリカ版 新・大学生物学の教科書 第3巻
Image by openclipart-vectors
この記事が気に入ったらサポートをしてみませんか?