スーパーコンピュータで薬を作る:理化学研究所 大阪地区 一般公開2019から学んだこと その02

詳細は「スーパーコンピューターで薬を作る.pdf」を参照。

2019年11月23日、私は理化学研究所 大阪地区(以下大阪地区)を訪れ、一般客として理化学研究所大阪地区一般公開2019(以下同一般公開)に参加した(1)。

生命機能科学研究センター(以下同センター)計算分子設計研究チーム(以下同チーム,2)は標的とする生体分子を制御するための分子を大規模計算機シミュレーションによって設計することを目標としている。生体高分子の立体構造が近年X 線構造解析やNMR により次々と明らかになっており、また、細胞内における生体高分子の挙動も計測技術の発達により次第に観察できるようになっているとはいえ、立体構造が分子機能にどう繋がるのかを予測するためには、原子スケールのモデルをもとにした長時間シミュレーションが必要になる。分子動力学計算や量子化学計算による分子シミュレーションを行うことが、生体高分子の機能の理解に繋がる。
同センターは内外との共同研究により、様々な標的分子に対して、培った手法を応用して新規化合物を設計している。また、分子動力学専用計算機を開発し、市販の計算機では不可能な長時間計算の実現を目指している。

同チームの研究テーマは以下の4つである。
1. 生体高分子と制御分子、ならびに、水和水の相互作用の、熱力学的、物理化学的特性の理解。
2. タンパク質/DNAと制御分子複合体の電子状態計算による触媒反応の解明。
3. 標的タンパク質に結合する新規ペプチド分子の設計。
4. 分子動力学専用計算機「MDGRAPE-4A」の開発。

同チームは「11.スーパーコンピュータを体感」で、分子動力学(Molecular Dynamics:MD)シミュレーション専用計算機「MDGRAPE-4A」(以下同機,図01,3)を紹介した。

画像1

図01.分子動力学シミュレーション専用計算機「MDGRAPE-4A」。

MDシミュレーションは、水溶液中で変化し続けるタンパク質構造を解析するために、タンパク質を構成する原子や周囲の水分子に働く力を計算し、コンピュータ内でタンパク質を「動かす」手法である。大きなタンパク質の解析には、汎用スーパーコンピュータでも膨大な時間がかかるため、分子シミュレーションを高速で行う専用スーパーコンピュータの開発が待たれていた。

今回、同チームは、自ら設計・開発した専用の大規模集積回路(LSI)(図02)を512個搭載し、システム全体として約1.3ペタフロップス(1,300兆回/秒)の計算能力を持つ同機を開発した。同機は、タンパク質と水分子からなる10万原子系のシミュレーションを、1日の計算で最高1.1マイクロ秒進める性能を有する(汎用スーパーコンピュータの5倍以上)。これにより、サブミリ秒(~100マイクロ秒)のタイムスケールで起きる水溶液中でのタンパク質と薬剤の分子間相互作用の解析が、現実的な時間で可能となる(図03)。

02.MDGRAPE-4A ボード

図02.「MDGRAPE-4A」ボード。

03.専用計算機を使った創薬

図03.専用計算機を使った創薬。

同機が開発された背景、概要、利点、および、応用を以下に示す(図04)。

背景
分子標的薬の開発は、がん細胞やウイルスや病原菌などの一部である標的タンパク質に結合し、その機能を阻害する化合物の探索が基本になる。しかし、タンパク質の構造は柔らかくゆらゆらと常に変化している。この様な構造変化はX線回折やNMR など従来の構造解析の手法では捉えきれない。一方、スーパーコンピュータを使った分子シミュレーションによって、標的タンパク質の構造変化を再現し、それと結合する化合物の候補を膨大な仮想化合物ライブラリの中からスクリーニングすることがインシリコ創薬として注目されている。

概要
タンパク質の構造変化の最も高精度なシミュレーションは、分子を構成する全ての原子の時々刻々の動きを計算しながら、いわば動画を1コマ1コマ進めるようにして行う。これがMD計算という手法で、現行のコンピュータでは約10ミリ秒/コマ掛かる。また、生体内でのタンパク質の大規模な構造変化を再現するには1兆コマ以上の計算が必要である(約300年かかる)。スーパーコンピュータを使っても、1コマ当たりの時間をミリ秒以下にすることは不可能である。そこで、同機ではMD計算で必要な粒子間の力の計算を専門に行うアクセラレーターを組みこんだLSIを実装し、1コマ当たりの計算を従来の汎用計算機の1,000倍のスピードで行うことを目指している。これにより、生体内での標的タンパク質の構造変化の高精度なシミュレーションを約3カ月の計算で達成できる。

利点
インシリコ創薬の技術はバーチャルな薬物構造式を用いて実施できるという大きな利点を有し、ほとんど無制限ともいえる数の化学構造式をスクリーニングの対象とすることができる。同機を使うことで、他のコンピュータでは不可能な時間MDを実行すれば、薬とタンパク質が実際に結合するときの構造変化を探索し、より高精度な予測が実現できる。

応用
インシリコ・スクリーニングを効率的に実施するために、複数の探索方法を階層的に組み合わせる(4)。
1.大規模な薬物ライブラリから創薬標的に適した薬物への絞り込みを高速に行う(Ligand-Based Drug Design法)(計算負荷:低)。
2.創薬標的分子の作用部位(ポケット)と薬物の立体構造を考慮した分子ドッキング法(Structure-Based Drug Design法)(計算負荷:中)。
3.MD計算を使用し、分子の動きと溶媒効果を考慮した高精度な結合親和性予測(計算負荷:高)。

04.開発と創薬への応用

図04.分子シミュレーション専用計算機「MDGRAPE-4」の開発と創薬への応用。

同チームは「14.コンピュータ・シミュレーションで見る生体分子の世界」で、タンパク質の構成要素、構造形成(折り畳み)、ならびに、構造と機能を紹介した(図05)。
タンパク質の構成要素
20種類のアミノ酸が連なることで、タンパク質が構成される。
アミノ酸は5種類の原子(炭素、水素、酸素、窒素、および/または、硫黄)で構成される。
タンパク質はらせん構造(αヘリックス)、シート構造(βシート)、および、これらを繋ぐループからなる基本的な構造パターン(二次構造)を含む。

タンパク質の構造形成(折り畳み)
計算機の高速化により一部の小型タンパク質では構造形成のシミュレーションが可能になりつつある。同チームはシミュレーションのデータを詳細に解析することでタンパク質構造形成の機序の解明を目指している。

タンパク質の構造と機能
あるタンパク質が酵素としての機能を発現するためには少なくとも、特定の分子(基質)の認識(特異性)、認識した分子に対する触媒反応、および、触媒された分子の放出という3つの異なる性質が必要となる。タンパク質はこの様な異なる機能をアミノ酸の種類や構造を変化させることで実現していると考えられている。MDシミュレーションでは、この様な構造の変化を詳細に調べることでタンパク質の機能の解明を目指している。

05.分子動力学

図05.タンパク質の構成要素、構造形成(折り畳み)、ならびに、構造と機能。

同チームは「分子ドッキングと分子動力学シミュレーションを用いた薬剤代謝酵素シトクロムP450(CYP1A2)活性部位における化合物の結合分布解析」で、分子ドッキングとMDシミュレーションを用いたシトクロムP450:CYP1A2の活性部位における化合物の結合分布解析を行った。その結果、フェナセチンの場合、2 位で正解の代謝部位が予測される結果が示された。最後に、予測した化合物の代謝部位候補(Top3)のうち、少なくとも 1 つが実験で知られている代謝部位である確率を評価した。同解析を全てのテストセット化合物に適用したところ、Top3 までに 78.9%の確率で正解の化合物の代謝部位を予測する結果が得られ、本研究で用いた手法の有効性が示された(図06,5)。

06.薬の体内での

図06.薬の体内での代謝を、コンピュータ・シミュレーションを用いて計測する。

同チームは大規模仮想化合物ライブラリを開発している。なお、これらの仮想化合物における100億個の化合物構造は同機で作られる(図07)。

背景
現在、創薬の初期では、多くの化合物集団から病気の治療標的である生体高分子(タンパク質など) に対して適切に相互作用する構造・物性を有する化合物を見つけ出すことが重要になっている。しかしながら、こうした化合物の発見は次第に難しくなっている。同チームはより多くの化合物からの探索を行えるように大規模仮想化合物ライブラリの開発を行っている。

化合物ライブラリとは?
 いくつもの種類の化合物を集めたコレクション。
 好ましい構造・物性を有する化合物をこの化合物ライブラリの中から探す。

「仮想」化合物ライブラリとは?
 実在しない仮想的な化合物も含めた化合物ライブラリ。
 仮想的な化合物はコンピュータを使っていくつでも作ることができる。
 このライブラリを上手く使うことで、化合物合成の時間も費用も少なく抑えることができる。

「大規模」仮想化合物ライブラリとは?
 創薬を目的とした製薬企業では通常数十万~数千万程度の仮想ライブラリが用いられている。
 同チームは創薬のために仮想ライブラリに含まれる化合物の数を100億程度まで増やすことを目的としている。

なぜ大規模にするのか?
 より多くの化合物を含むライブラリから探すことで、好ましい構造・物性を有する化合物を見つけられる可能性がより高くなる。
 薬の候補となる化合物の数は理論的には1060個ほどあると見積もられている。
 100億個(=10^10)の化合物ライブラリが作られているとはいえ、ほんの一部しか見られていない。

どの様に作るの?
 ライブラリから取り出した化合物に対して、何通りもの既知の合成反応をコンピュータで仮想的に適用すると、多くの新規化合物を生成できる。これを繰り返して大量の化合物を生成する。
 非実在の化合物を入手するためには合成方法がわかる必要がある。適用した合成反応を記録しておくことで、合成手順を再現できる。
 同チームはこの方法で大規模な仮想化合物ライブラリを構築する独自のコンピュータ・ソフトウェアを開発している。

どの様に使うの?
 類似構造、部分構造、物性などの条件で検索する。
 インシリコ・スクリーニングで、大量の化合物から少数の薬物候補化合物へと高速に絞り込みを行う。
 最終段階では同機などの高速なコンピュータを使って、精密に化合物を調べる。

07.ライブラリ

図07.100億個の化合物構造をコンピュータで作る大規模仮想化合物ライブラリの開発。

同チームは、2020年03月23日、新型コロナウイルス感染症(COVID-19)の原因ウイルスである「SARS-CoV-2」のメイン・プロテアーゼの10マイクロ秒間(1マイクロ秒は100万分の1秒)にわたる構造動態を、同機を用いてシミュレートし、かつ、その生データを世界の創薬研究者に自由に利用してもらうため、リポジトリMendeley Dataで17日に公開したことを発表した。
本データは、ウイルス増殖に必須であるプロテアーゼ活性を効率よく阻害する阻害薬の開発、候補分子のスクリーニングなどに役立つと期待される(6)。

同チームはまた、2020年11月10日、SARS-CoV-2のメイン・プロテアーゼタンパク質と7種類のヒト免疫不全ウイルス(HIV)プロテアーゼ阻害薬が結合する過程のMDシミュレーションの実施も発表した。
サンプル数の制約のため、各薬分子の優劣を正確に予測することは難しいとはいえ、このMDシミュレーションにおいて、インディナビルは有意にダルナビルよりも親和性が高い傾向を見せた。
本研究成果は、新型コロナウイルスの増殖に必須であるメイン・プロテアーゼを標的とする治療薬の開発に役立つと期待される(7)。

同機を使用する同センター同チームを含む理化学研究所による治療薬とワクチン、特にCOVID-19に対するそれらの開発を私は期待する(8)。

参考文献
1 国立研究開発法人 理化学研究所 大阪地区.“大阪地区一般公開2019 開催報告”.理化学研究所 大阪地区 ホームページ.お知らせ.2019年12月25日.https://osaka.riken.jp/open2019/report.html,(参照2020年10月05日).
2 国立研究開発法人 理化学研究所 生命機能科学研究センター.“計算分子設計研究チーム”.理化学研究所 生命機能科学研究センター ホームページ.研究室・施設.研究室.https://www.bdr.riken.jp/jp/research/labs/taiji-m-computational/index.html,(参照2020年10月05日).
3 国立研究開発法人 理化学研究所.“理化学研究所 創薬専用スパコンの開発 - 分子シミュレーション専用計算機「MDGRAPE-4A」-”.理化学研究所 ホームページ.研究成果(プレスリリース).研究成果(プレスリリース)2019.2019年11月18日.https://www.riken.jp/press/2019/20191118_2/,(参照2020年12月01日).
4 国立大学法人 神戸大学 計算科学教育センター.“「創薬における計算生命科学:インフォマティクスとシミュレーションを融合したインシリコ・スクリーニング」(担当:本間光貴)”.神戸大学 計算科学教育センター トップページ.遠隔講義.計算生命科学の基礎III(→講義動画公開中).http://www.eccse.kobe-u.ac.jp/assets/images/distance_learning/life_science3/dac78e10ec33e990a2b78e33c6358df3227a18b7.pdf,(参照2020年12月03日).
5 分子科学会.“3P101 分子ドッキングと分子動力学シミュレーションを用いたシトクロムP450(CYP1A2)活性部位における化合物の結合分布解析(理研・生命システム1,北陸先端大2)○齋藤大明1,水上卓2,平野秀典1,大塚教雄1,沖本憲明1,泰地 真弘人1”.第10回分子科学討論会 2016 神戸 ホームページ.講演プログラム&要旨.ポスター発表 第3日(9月15日(木)).http://molsci.center.ims.ac.jp/area/2016/lectures/pdf/3P101_m.pdf,(参照2020年12月29日).
6 国立研究開発法人 理化学研究所.“新型コロナウイルス(SARS-CoV-2)メイン・プロテアーゼの分子動力学シミュレーションデータを公開”.理化学研究所 ホームページ.研究成果(プレスリリース).研究成果(プレスリリース)2020.2020年03月23日.https://www.riken.jp/press/2020/20200323_2/index.html,(参照2020年12月30日).
7 国立研究開発法人 理化学研究所.“新型コロナウイルスタンパク質の柔らかい構造-薬分子結合過程の分子動力学シミュレーション-”.理化学研究所 ホームページ.研究成果(プレスリリース).研究成果(プレスリリース)2020.2020年11月10日.https://www.riken.jp/press/2020/20201110_3/index.html,(参照2020年12月30日).
8 国立研究開発法人 理化学研究所.“新型コロナウイルスに関する研究開発(2021年01月22日更新)”.理化学研究所 ホームページ.https://www.riken.jp/covid-19-rd/,(参照2021年01月25日).


この記事が気に入ったらサポートをしてみませんか?