見出し画像

特集 いま、スーパーコンピュータでCOVID-19に立ち向かう

2020年以来、世界を覆う新型コロナウイルス感染症(COVID-19)の猛威。 一日でも早い終息に向けて、世界中の計算科学・データ科学・計算機科学の研究者が、 スーパーコンピュータを用いた様々な研究に取り組んでいます。 本特集では、その最前線を担うスーパーコンピュータがどのような発想で開発・運用されているのか、 どのようにCOVID-19対策研究に用いられているのか、 研究者へのインタビューでご紹介します。

写真:東京大学情報基盤センターで2021年5月に運用開始したスパコン Wisteria/BDEC-01 のシミュレーションノード群(Odyssey)

スーパーコンピュータで人類と地球を護る

中島研吾 (東京大学情報基盤センター スーパーコンピューティング研究部門 教授)

KEY POINTS
▶ COVID-19に関する研究のため、スパコンの利用枠が迅速に用意された。
▶ 大学のスパコンは、「開かれたスパコン」として多くの分野で活用される。
▶ 次世代スパコンはサイバー・フィジカル空間の融合でSociety5.0実現を目指す。

 2020年春に世界がコロナ禍に突入して以降、多くの研究者が問題解決のために何らかの貢献をすべく様々な活動を実施してきました。スーパーコンピュータ(スパコン)を使用した新型コロナウイルス感染症(COVID-19)に関する研究は米国を中心に世界的に盛んに行われています。我々、情報基盤センタースーパーコンピューティング研究部門でも、HPCI※1からの呼びかけに応える形で、COVID-19に関する研究に対してスパコン資源を提供してきました。

「2020年度HPCIシステム利用研究課題募集における新型コロナウイルス感染症(COVID-19)対応臨時公募」で採択された課題は、表1に示す6件です。内容としては、ウイルスのタンパク質の挙動に関連した分子シミュレーションが多いですね。望月祐志先生、杉田有治先生、星野忠次先生の課題はいずれも新型コロナウイルスに関連した分子シミュレーションです。我が国でCOVID-19に関連したシミュレーションとして最も広く知られているのは、坪倉誠先生の「ウイルス飛沫のシミュレーション」です。飛沫拡散のシミュレーション映像はTV等でもよく放送されていました。このシミュレーションに「富岳」が使われていることも良く知られていますが、実は当センターのOakbridge-CX(OBCX)も使用されています。

情報基盤センターのスパコンの性能と利用分野

 それでは、当センターのスパコンはどのようなシステムで、どんな形で利用されているか、少しご紹介しましょう。

 2021年度前半、当センターは4つのスーパーコンピューティングシステム[Reedbush、Oakforest -PACS、Oakbridge-CX、Wisteria/BDEC-01]を運用していましたが、そのうち、Reedbushは11月末に運用終了となり、現在、3システムが稼働していますが、Oakforest-PACSは今年度末に運用終了予定です。残る2つ、Oakbridge-CX、Wisteria/BDEC-01は今後、しばらくの間、運用されます。当センターは2010年から「学際大規模情報基盤共同利用・共同研究拠点中核拠点」※2となっていて、スパコンを運用している7つの他大学とともにネットワーク拠点を形成し、東大はその中核拠点として活動しています。また、※1に示したようにHPCIの第二階層のひとつとして「富岳」とともに研究者に活用されています。

 当センターのスパコンは共同利用・共同研究拠点の施設ですので、学内ユーザーと学外ユーザーの区別はありません。利用者は年間のべ2,600人くらいで、55%以上は学外の研究者です。ここ数年の傾向として、だんだん学外ユーザーが増えてきており、今後もますます「開かれたスパコン」として全国の研究者に活用されていくでしょう。

 世界のスパコンの処理能力を順位づけした『TOP500』(http://www.top500.org/)というランキングがあるのですが、2021年11月現在で、世界1位(日本1位)が理化学研究所の「富岳」、世界16位(日本2位)に産総研のABCI 2.0、世界17位(日本3位)に当センターのWisteria/BDEC-01(Odyssey,シミュレーションノード群)が入っています。また、電力当たりの計算効率で評価した『Green500』(http://www.green500.org/)というランキングでもWisteria/BDEC-01は上位に入っており、とても効率が良いです。利用者の皆様からは電気代相当の負担金をいただいていますが、2012年頃のシステムではピーク性能1GFLOPSあたり年額125円の負担だったのが、現在、Wisteria/BDEC-01のシミュレーションノード群(Odyssey)では約18円、データ・学習ノード群(Aquarius)では約8円まで下がってきています。家電などでも新しい機種ほど消費電力が少なくて済みますが、それと同じです。

 次に、利用分野です(図A)。2020年度、Oakforest-PACSは「地球科学・宇宙科学」、「材料科学」、「エネルギー・物理学」、また、Oakbridge-CXは「工学・ものづくり」、「材料科学」、「エネルギー・物理学」など、計算科学的な分野での利用が非常に多いです。最近は、特にGPUクラスタを中心に、ゲノム解析や医用画像処理などの「バイオインフォマティクス」やAIに関連した情報科学の研究など、新しい分野に広く使われるようになっています。以前から、当センターのスパコンは学内の大気海洋研究所(大海研)や地震研究所(地震研)の研究者が、「全地球大気環境シミュレーション」や「三次元地震シミュレーション」等の大規模シミュレーションに使用していました。

 地震発生時の波動伝播の計算は、震源を仮定したシミュレーション、いわゆるフォワードシミュレーションを実施していました。現実に近いような形で震源を仮定することは非常に難しいため、シミュレーションで正しい解を得ることはなかなか難しい。そこで、観測データを積極的に利用する手法が、東大地震研の古村孝志先生らによって提案されています。新しい手法では、観測データを内挿して初期状態を求め、シミュレーションと観測データによる補正、すなわちデータ同化を融合した計算を実施し、ある時点でシミュレーションのみに切り替えます。また、地震シミュレーションを実施するための三次元地下構造にはまだ不明な点が多く、地震発生のたびに逆解析を実施して地下構造モデルを修正しています。小規模な地震観測データと機械学習の活用によって、より精度の高い三次元地下構造モデルを効率よく生成するための手法の研究も実施されています。

 スーパーコンピューティングは、従来の計算科学(Simulation, S)から、データ科学(Data, D)、学習・AI (Learning, L)を含む幅広い分野で利用されるようになっています。

「S+D+L」融合による Society 5.0実現への貢献

 Society 5.0は、日本が提唱する未来社会のコンセプトで、2016年に始まった第5期科学技術基本計画のキャッチフレーズとして登場しました。サイバー空間(仮想空間)とフィジカル空間(現実空間)を高度に融合させたシステムにより、経済発展と社会的課題の解決を両立する、新たな未来社会という位置づけです。

 当センターでは2015年頃から、「計算・データ・学習(S+D+L)」融合の重要性に着目し、更にSociety 5.0を実現するためのスーパーコンピュータシステム、ソフトウェア、アルゴリズム、アプリケーションのための研究開発を開始し、「BDEC計画(Big Data & ExtremeComputing)」と名付けました。

 2021年5月14日に運用を開始したWisteria/BDEC-01はこのBDEC計画の1号機です。このシステムの特徴はシミュレーションノード群『Odyssey』とデータ・学習ノード群『Aquarius』に分かれているところです。Odysseyは「富岳」と同じCPUであるA64FXを搭載したFujitsu PRIMEHPC FX1000というシステムで、規模としては「富岳」の約20分の1です。Aquariusには最新GPUであるNVIDIA A100 Tensorコアを搭載しています。

 計算科学シミュレーションの多くは非線形のため、一回の計算で正しい答えがでるわけではなく、パラメータを調整しながら、数十ケースのシミュレーションを実施するパラメータスタディが必須です。天気予報のシミュレーションや坪倉先生の飛沫シミュレーションでもパラメータスタディが実施されています。

 Wisteria/BDEC-01は、データ・学習ノード群(Aquarius)上で、機械学習・AIの手法を駆使して、最適なパラメータを効率的に決定し、シミュレーションノード群(Odyssey)でパラメータスタディを効率的に実施することを目指して開発されたシステムです(図B)。

 異なるアーキテクチャに基づくノード群を連携し、「S+D+L」融合を実現するためのソフトウェア群の開発も実施しています。

※1 [ハイパフォーマンス・コンピューティング・インフラストラクチャ] 「富岳」を中心に全国の大学・研究機関のスパコンをネットワークで結んだシステム。東大情報基盤センターのスパコンはナショナルフラッグシップシステム(富岳)を支える第二階層のひとつとしてこのシステムに組み込まれている。 https://www.hpci-office.jp

※2 [学際大規模情報基盤共同利用・共同研究拠点中核拠点] 北海道大学、東北大学、東京大学、東京工業大学、名古屋大学、京都大学、大阪大学、九州大学にそれぞれ附置するスーパーコンピュータを持つ8つの施設を構成拠点とし、東京大学情報基盤センターがその中核拠点として機能する「ネットワーク型」共同利用・共同研究拠点のこと。 https://jhpcn-kyoten.itc.u-tokyo.ac.jp/ja/

中島研吾/専門は数値流体力学、並列数値アルゴリズム。
東大工学部航空学科卒業、テキサス大学大学院修士課程修了(航空宇宙工学)、博士(工学)。三菱総合研究所、東大理学系研究科を経て2008年より現職。2018年より理化学研究所計算科学研究センター副センター長を兼務。

東京大学情報基盤センター nodes vol.1  CONTENTS
創刊にあたって
[特集] いま、スーパーコンピュータでCOVID-19に立ち向かう
  スパコンで薬剤の効果を探る
  見えない飛沫を可視化する
[連載] nodesの光明
  全学授業オンライン化で「ユーザー目線の大切さ」を痛感
[連載] 飛翔するnodes
  30秒ごとに更新する「ゲリラ豪雨予測システム」を開発
  「冬眠するブラックホール」の実態を解明
nodesのひろがり
  動物の鳴き声の変化を可視化
  真の教育とは何か
  野生動物にセンサーを装着
  センターの研究をバズらせるために
編集後記
全文一気読みバージョンはこちら

この記事が気に入ったらサポートをしてみませんか?