見出し画像

ACMゴードン・ベル賞と新型コロナ飛沫・エアロゾル感染リスク評価のデジタルトランスフォーメーション

松岡 聡
(理化学研究所計算科学研究センター/東京工業大学情報理工学院)

坪倉 誠
(理化学研究所計算科学研究センター/神戸大学大学院システム情報学研究科)

 ゴードン・ベル賞(ACM Gordon Bell Prize)は,スーパーコンピュータを用いたHPC(ハイパフォーマンスコンピューティング)の卓越した業績を称え,ACM(Association for Computing Machinery)の学会賞として年に一度,授与される.世界中のトップマシン上で,多くの最先端のアプリケーションとその成果が競い合い,その受賞者ならびに実行されたマシン自身が最高の栄誉にあずかるだけでなく,HPCの進歩,特に超並列計算の技術を大幅に高めることにも大いに貢献してきた.

 ゴードン・ベル賞は,その源流はDEC(Digital Equipment Corporation)(現HPE(Hewlett Packard Enterprise))の計算機アーキテクトであったC. Gordon Bell氏の個人的な賞として,1987年に創設された賞であり,並列計算の進歩を顕彰することを目的に設立された.設立の背景として,この時期のアメリカを中心とした超並列コンピュータ開発の勃興と,その限界に関する議論が挙げられる.

 当時のスーパーコンピュータは,単独のCPUを高速化するのが性能向上の手法のメインで,並列計算による速度向上は数~数十CPUまでと,現代の「富岳」における一千万近い並列度と比べると非常に小規模であった.その理由は,並列計算におけるアルゴリズムの性能向上の限界指標として,かのGene Amdahlが提唱したアムダールの法則が存在することにある;アムダールの法則は,アルゴリズム中に並列処理できない非並列化部分があると,CPU数を増加させても,非並列化部分で実行時間の短縮が律速されてしまい,急速に性能向上が限界に達することを示している.この法則ゆえ,当時IBM研究所のAlan H. Karp氏や,高性能計算機アーキテクチャのトップリーダであったSeymour Roger Cray氏などのHPC界の重鎮は,科学技術における実際の問題解決に,当時開発が進みつつあった超並列計算機が実際に役立つことに懐疑的であり,Gordon Bell氏自身も必ずしも楽観的ではなかった.そこで,超並列計算の実用性へのチャレンジとして,ゴードン・ベル賞がAlan H. Karp氏とGordon Bell氏による一種の「賭け」として1987年に設けられたのである.つまり,アムダール則の限界を回避し,実際の超並列計算で画期的な性能向上を示した実際のアプリケーションのチームに賞金を与える,というものである.

 幸い,初回からその「賭け」に挑戦し,CPUの並列数に強く相関した性能向上を果たしたチームが複数あらわれたが,その中でも明らかな勝者は,John Gustafsonを含んだ米Sandia国立研のチームであり,1024 CPUのnCUBEマシンで400〜600倍の性能向上を示した.ここで重要だったのが,後にグスタフソンの法則と呼ばれる性能向上の手法の発見である.彼らが着目したのは,アムダール則は破れないので,ある固定されたデータの処理に関する実行時間を並列化で短縮(強スケーリング)するのは困難だが,並列度の向上に比例させて問題サイズも大きくすれば(弱スケーリング),実行時間自身はほぼ一定で推移するも,非並列化部分の全体の性能に占める割合は反比例して小さくなり,最終的にはCPU数の増加に比例した性能向上が得られる,というものである.あとは,それが実際の問題解決に重要であるかだが,多くの実問題は弱スケール性を示すことが分かり,結果としてグスタフソン則の有用性も明らかになった.

 グスタフソン則の「発見」により,超並列計算による劇的なスーパーコンピュータの性能向上の道が開かれるとともに,ゴードン・ベル賞はその最先端の世界を競う賞として発展していった.1992年からは,ACMとIEEEが毎年共同主催するSupercomputing - SC国際会議に表彰が組み込まれ,さらに2006年以降はACM(Association for Computing Machinery)の正式な学会賞となり,その表彰規則にのっとって与えられるようになった.現在では,HPC分野だけでなく情報・計算分野全体で鑑みても大変権威ある賞の一つとなっている.日本からも「京」やTSUBAME,「富岳」上でのアプリケーションが受賞しており,トップスパコンの実用性の証となっている.

 ACMの学会賞となったゴードン・ベル賞は,通常スーパーコンピュータがランキングされる,いわゆるスパコンの性能指標として一般的に実施されるベンチマーク,たとえば密行列や疎行列を対象とした大規模連立一次方程式解法(前者はHPL: High-Performance LINPACK,後者はHPCG: High-Performance Conjugate Gradient)などとは異なり,科学・工学などの実分野におけるシミュレーションや大規模データ解析の実用問題における画期的な成果を対象としているのが大きな特徴である.賞へのエントリは,毎年4月初旬を締め切りとして,達成されたアプリケーションの成果の詳細を記した論文形式で行われる.数十件にものぼる応募論文に対して,ACMが選出した審査委員会が,スパコンの性能を引き出すために開発された手法の革新性,それにより達成された性能や結果を得るまでの時間の短縮,それにより実現した科学技術としての価値や社会的インパクト,といった3つの項目・観点から審査を行い,6件程度の最終選考対象であるファイナリストを決定し,初夏に公表する.ファイナリストは,8月までに,さらに上記3項目の改善を行い,それを反映した論文を再提出して,それに基づき最終審査が行われる.さらに,ファイナリストは11月に開催されるSC国際会議において,審査論文は会議録に他の査読論文と同等に掲載され,特別セッションでプレゼンを行った上で,同会議の表彰セッションで受賞者が発表・表彰される(筆者の一人の松岡も,2018年は審査委員長として選考にあたっている).

 さらに,2020年と2021年には,COVID-19の世界的なパンデミックに対し,多くのスパコンがその解決に貢献したことを鑑み,COVID-19に関する特別賞も設けられた(ACM Gordon Bell Special Prize for High Performance Computing-Based COVID-19 Research).この特別賞は通常の賞と並行して与えられ,審査内容や基準は基本同等であり,賞としての権威も同等で,トップスパコン上で行われた研究から数多くのエントリがあった.

 ゴードン・ベル賞はその年のトップスパコンのアプリケーションを比較するのが本質なので,一部マスコミで言われている「HPC界のノーベル賞」いう比喩は正確ではない.ノーベル賞は基本的にはキャリア賞であり,個人の業績に与えられ,それに相当する賞は別途存在する(IEEE Cray賞,IEEE Fernbach賞,ACM/IEEE Kennedy賞).むしろ,その年のいわゆるベストなアプリケーションを比較して最高のものを選ぶ,という点では,映画界におけるオスカー・アカデミー作品賞に近い.その点,アカデミー賞と同様,ファイナリストになること自体がそもそも大きなチャレンジであり,十分栄誉に値することも類似している,と言えよう.

 2021年のSC国際会議は,ミズーリ州セントルイスで,ハイブリッド形式で開催された.従来賞ではファイナリストとして以下の6つの課題が採択された.すなわち,専用機による分子動力学シミュレーション,現在世界最速の「富岳」を用いた超大規模宇宙ニュートリノシミュレーション,米最速で世界2位のサミットシステムによる極限状態での炭素を対象とした分子動力学シミュレーションのほか,SC 21でその全容が明らかになりつつある中国の新しいSunwayシステムを用いた3つのシミュレーションとして超大規模量子ラマンスペクトルシミュレーション,超大規模トカマク核融合シミュレーション,そして量子回路シミュレーションがノミネートされ,精華大学のグループによる量子回路シミュレーションが受賞した.同様にCOVID-19特別賞でも6つの課題がファイナリストとして選出された.我々が受賞した飛沫エアロゾル感染リスク評価のデジタルトランスフォーメーション[1]のほか,創薬を目的としたディープラーニングによるタンパク質親和性解析,エージェントベースモデルに基づく社会シミュレーションを支援するデータ駆動型パイプライン,AI支援によるウイルスおよびエアロゾルの動態シミュレーション,創薬を目的とした膨大な数のタンパク質―リガント結合シミュレーション,ヒト細胞内でのコロナウイルスの複製に関するAI支援シミュレーションがファイナリストとしてノミネートされた.

 HPCの利用としては大きく,キャパシティ(Capacity)コンピューティングとケーパビリティ(Capability)コンピューティングに分類することができる.前者は限られた時間の中でいかに多数のケース(ジョブ)を処理できるかを主目的とする一方,後者は,従来は扱えなかったような大規模な問題を高速に処理することを目的とする.ゴードン・ベル賞については,その本来の主旨からも,ケーパビリティコンピューティングを競うのが一般的であったが,近年ではデータ駆動型やAI活用を視野に入れたキャパシティコンピューティングの課題についてもファイナリストとして採択されつつある.今回のゴードン・ベル賞で特徴的だったのは,従来賞についてはケーパビリティが主体である一方,COVID-19特別賞については,キャパシティが主体である点である.刻々と変化する感染状況に対して,限られた時間の中で有用な成果を得るためには,ケーパビリティによるいわばワンショットシミュレーションに対して,やはりキャパシティコンピューティングが有効であったということが言える.我々の課題も,感染状況に応じて50以上の感染シーンに対して1,000ケースを上回るリスク評価と対策提案を,社会が必要とするタイミングと内容で提案したことが評価された.ACMの同賞委員会長のMark Parsons委員長も受賞に際して,「この成果は特に感染初期段階の日本そして世界で,公衆の行動を変えた」と評した.図-1は,この2年間に我々が実施したシミュレーションのごく一部を,日本の日々の新規感染者数の推移とともに示している.

図-1 我が国の新規感染者数の推移と「富岳」で実施してきた感染リスク評価と対策シミュレーションの一部

 本プロジェクトは,当時まだ試運転中であった「富岳」の計算資源を新型コロナウイルスの対策目的とした研究に供与するという文部科学省と理化学研究所の決定に応募・採択されたことを受けて,パンデミック宣言から1カ月後の2020年の4月に始動した.その後,感染状況のタイミングを見計らって現在までに2~3カ月に一度程度,理研記者勉強会という形態でメディアに対してシミュレーション結果を開示し,その説明を行ってきた.発表内容は350を超える新聞,350を超えるテレビ・ラジオ,1,400を超えるWebニュースで取り上げられ,特に一般社会に対して飛沫・エアロゾル感染リスクの科学的理解と,マスクやパーティション,換気といったリスク低減対策の重要さを啓発した.また,日本国内にとどまらず,世界各国でも報道されたようである.活動当初はこれだけのメディアに取り上げられるとは我々も想定していなかったが,今から考えれば,新興感染症に対する科学的データの不足や,エアロゾル感染という空気感染と飛沫感染のいわば中間の一般的理解や従来の簡易なリスク評価が難しい感染形態といった背景が大きかったと思われる.緊急事態宣言下で物理的に実験室へのアクセスが難しい中,スパコンさえ動いていてインターネットでアクセスさえできれば平常時と変わらず(あるいはそれ以上に)成果の創出が可能であった上に,結果を可視化・動画化することで,容易に視覚的にエアロゾルの拡散をとらえることができたことで,シミュレーションのメリットがいかんなく発揮できた事例となった.図-2は,日々の感染状況とともに,我々が消費した「富岳」の計算資源を,日々の利用量(左)と積算量(右)で表示している(活動開始の2020年4月からゴードン・ベル賞エントリの2021年9月まで).感染のピークの少し前に計算資源消費のピークが来るのが特徴的である.これは,我々の活動の大きな目的の1つが,社会経済活動の早期回復であったため,感染拡大がある程度収束して一般社会の皆さんが社会活動に戻るタイミングでの発表を目指してきたからである.2021年9月までの1年半で我々が消費した「富岳」計算資源は,1,750万ノード時間に及び,これは,日本で5位程度のIntel系の汎用スパコンをほぼ1年,占有して利用するのに等しい.ではなぜ,このようないわゆる感染リスク評価のデジタルトランスフォーメーション [2],[3] が実現したのであろうか?

図-2 我が国の新規感染者数の推移と飛沫シミュレーションで用いた「富岳」計算資源(左:毎日,右:積算量)

 我々のシミュレーションは,理研計算科学研究センターで2012年から産学連携で研究開発を進めてきた複雑現象統一的解法フレームワークCUBE[4]を用いて解析を行っている.飛沫はその一つひとつに対して,ニュートンの運動法則に空気から受ける流体力を考慮した運動方程式を立てて,ラグランジュ的に解いている.一方飛沫周りの空気の流れについては,ナビエ・ストークスの方程式を,空間に固定されたオイラー格子上で解いている.また飛沫と空気との間の熱のやりとりに基づき,飛沫の蒸発による粒径変化や壁での付着等も考慮に入れて解析を行っている.物理現象としては液滴飛沫と空気との連成問題であり複雑系ではあるが,市販の流体シミュレーションソフトで解析ができないものではない.ここでは,CUBEにすでに実装されていた,自動車エンジン用の燃料噴霧モデルを急遽,飛沫シミュレーションに転用している[5].市販ソフトウェアと異なるCUBEの特徴は,まずデータ構造としてBuilding Cube Methodと呼ばれる階層直交格子を採用し,CPU単体性能および並列性能の両面でハイエンドスパコンの能力を引き出しやすいよう工夫されている点と,計算モデル作成の際に重要となる物体表面のデータ修正を極力排除することで,一般的なソフトウェアの前処理を数百倍に加速させた点にある.流体シミュレーションでは,オイラー的に空間に計算格子を作成する必要があるが,この際,物体表面からの流体の漏れを防ぐために,物体表面に気密性を確保する必要がある.一方,自動車に代表されるような数千個の部品が集まったデジタルデータ(CAD,Computer-Aided Design)では,部品間の隙間や重合が避けられなく,気密性を確保するために膨大な工数が必要となる.CUBEではこの問題を克服し,空間解像度に応じて自動的に修正処理がなされるよう工夫がされている[6].この結果,実車体のCADデータが提供されれば,通常では1週間程度かかるモデル修正と計算格子作成が,わずか30分程度で完了してしまう.図-3は「富岳」とCUBEで実現した世界最大規模の実自動車形状を対象とした空力シミュレーションの一例である.COVID-19対策におけるこのモデル作成の高速化の効果は絶大であった.

図-3 「富岳」とCUBEで実施した世界最大規模の自動車空力シミュレーション

 以上,ACMゴードン・ベル賞の概要と,2021年度,COVID-19特別賞を受賞した「富岳」で実現した「新型コロナ感染リスク評価のデジタルトランスフォーメーション」の概要について説明した.産業界の要求に応えるためにCUBEで実現したシミュレーションモデル作成の抜本的な加速が,世界最速スパコン「富岳」の登場と相まって,思わぬ方向で新型コロナという社会的問題への対応の一助となった.現在は,ウィズコロナ時代の社会経済活動の再開に向けて,内閣府等とも連携して政策やガイドライン等の策定や改定のためのデータを提供している.また,ポストコロナ時代を見据えて,快適性を維持しつつ感染症に対してもレジリエントな室内環境設計を実現すべく,産業界とも連携して飛沫・飛沫核感染リスク評価シミュレーションの精度向上に関する研究開発を進めている.

参考文献
1)Ando, K., Bale, R., Li, C-G., Matsuoka, S., Onishi, K. and Tsubokura, M.: Finalist of the ACM Gordon Bell Special Prize for High Performance Computing-Based COVID-19 Research: Digital Transformation of Droplet/Aerosol Infection Risk Assessment Realized on “Fugaku” for the Fight against COVID-19, The International Conference for High Performance Computing, Networking, Storage, and Analysis (SC21) (Nov. 14-19, St. Louis) (2021).
2)Onishi, K., Iida, A., Yamakawa, M. and Tsubokura, M.: Numerical Analysis of the Efficiency of Face Masks for Preventing Droplet Airborne Infections, Physics of Fluids, Vol.34, No.3, 033309 (2022), https://doi.org/10.1063/5.0083250
3)Bale, R., Li, C-G., Yamakawa, M., Iida, A., Kurose, R. and Tsubokura, M. (Best Paper Award): Simulation of Droplet Dispersion in COVID-19 Type Pandemics on Fugaku, In Proceedings of the Platform for Advanced Scientific Computing Conference (PASC21), pp.1-11 (2021), https://doi.org/10.1145/3468267.3470575
4)Jansson, N., Bale, R., Onishi, K. and Tsubokura, M.: CUBE: A Scalable Framework for Large-scale Industrial Simulations, International Journal of High Performance Computing Applications, Vol.33, No.4, pp.678-698 (2018), DOI: 10.1177/1094342018816377
5)Bale, R., Wang, W. H., Li, C-G., Onishi, K., Uchida, K., Fujimoto, H., Kurose, R. and Tsubokura, M.: A Scalable Framework for Numerical Simulation of Combustion in Internal Combustion Engines: In Proceedings of the Platform for Advanced Scientific Computing Conference (PASC20), pp.1-10 (2020), doi.org/10.1145/3394277.3401859 (29 June-1 July, 2020, Geneva, Postponed).
6)Onishi, K. and Tsubokura, M.: Topology-free Immersed Boundary Method for Incompressible Turbulence Flows: An Aerodynamic Simulation for “dirty” CAD Geometry, Computer Methods in Applied Mechanics and Engineering, Vol.378, 113734 (2021), https://doi.org/10.1016/j.cma.2021.113734

(2022年4月4日受付)
(2022年4月15日note掲載)

■松岡 聡(正会員)
理化学研究所計算科学研究センター(Riken R-CCS) センター長.東京大学理学系研究科情報科学専攻博士(理学).東京工業大学情報理工学院特任教授(兼職).スーパコンピュータTSUBAME開発で省電力等の指標で世界トップランク.米国計算機学会ACMフェロー,日本ソフトウェア科学会フェロー,Gordon Bell賞(2011,2021),スパコン分野最高峰賞IEEE Sidney Fernbach賞(2014)を日本人として初受賞.史上初世界1位4冠達成4期連続(2020,2021)のスーパーコンピュータ「富岳」の総責任者. 2018年より現職.

■坪倉 誠(正会員)
1997年3月東京大学博士課程修了,博士(工学)授与.東京工業大学,電気通信大学,北海道大学を経て2015年4月より神戸大学システム情報学研究科教授.また2017年よりクロスアポイントメントにより理研計算科学研究センターチームリーダー採用.熱流体をはじめとする連続体のシミュレーション技術の研究開発と特にスパコンを用いた大規模並列解析とその産業応用が専門.日本機械学会,日本流体力学会,自動車技術会のフェロー.日本工学アカデミー会員.