見出し画像

AI/MLと数値天気予報

 5/13のECMWFのFlorian Pappenburger予報部長のAI/ML予報の講演、そして、JpGU(日本地球惑星科学連合)2024大会の"Data-driven approaches for weather and hydrological predictions"セッションの発表を聞いて、AI/MLと気象予測について感じたことを記録しておきます。あくまでも個人的見解ですが、日本の将来にとっても重要な技術ですので、若いみなさんのこれからの研究のヒントや動機付けになればと思います。

数値天気予報(数値予報)については、私もnoteに解説を書いています。

数値予報については、その2、その3もあり、さらに欧米と日本の数値モデリングの状況なども解説を書いていますので、関心のある方はご覧ください。もちろん、著書「ビジネス教養としての気象学」を読んでいただくとより全体像が見えてくるものと思います。

このように気象関係者の血と汗と涙の努力とスパコンの発展でここまで発展してきた数値天気予報に対して、AI/MLによる予測が匹敵そして凌駕しつつある、という最近の報告を聞いていろいろと感じるところはあります。
なぜAI予測がこれまでの数値天気予報で使われる物理モデルと同等以上の性能を発揮するようになったのでしょうか。まず、数値天気予報の誤差の原因から考えてみましょう。
私の一連の解説をお読みいただければわかるかと思いますが、数値天気予報の誤差の主な原因は下記の通りです。
1 観測等に起因する初期値の誤差の時間発展
2 数値モデルの分解能の粗さに起因する誤差
3 物理過程とも呼ばれるパラメタリゼーションの誤差
カオスの説明などでは1の誤差が強調されますし、スパコンの高速化に絡めて2も強調されることもあります。気象予報士試験でも1と2の誤差はよく出題されています。しかし、若い頃3に関わっていた経験もあるからかもしれませんが、3の誤差が実は相当あるものと認識しています。物理過程には、放射過程、雲過程、積雲対流、乱流、陸面過程、大気海洋相互作用等さまざまなものがあります。それぞれの過程で誤差がありますが、さらに複数の物理過程の誤差が相互作用したりして、全体の誤差と個々の物理過程との関係が見えにくくなっているという事情もあります。
個々の物理過程の誤差が相互作用しつつ重なり合うことで、数値天気予報の誤差がある一方、機械学習ではこのような物理過程はなく、高気圧や低気圧がどう移動し発達衰弱するかを長期間の再解析データを使って対応関係を学習しその統計的関係に基づき予測しています。高気圧や低気圧の動きは過去の再解析データでかなり精度の高い教師データが長期間あります。それでざっくり学習させて予測することにより、積雲対流のパラメタリゼーションや雲放射過程などの物理過程から生じる誤差よりも小さな誤差で高気圧低気圧を予測できる、ということなのかなあ、と悟りつつあります。
3日先予報の高気圧低気圧の予測は機械学習の得意なところのようですが、線状降水帯とか台風の強度などはそう簡単ではなく、教師データのサンプル数が少ない、統計的な関係がそう明確ではないといった背景があるように思います。
一方、物理的手法による数値天気予報にAI/MLによる天気予報が勝った、もうスパコンによる複雑な計算は必要ない、というわけではないのです。AI/MLには教師データが必要で、気象再解析データが使われています。気象再解析というのは、下記にも説明があるとおり、普段の数値天気予報に使われている予測解析プログラムを使って過去の観測データから過去の解析を行った結果です。

普段の天気予報のために、磨き上げられた数値天気予報の技術あって初めて良質な再解析データができる、という仕組みです。スパコンで日々天気予報をしていることが必要なのです。
一方、実は、数値天気予報の仕組みの中にもAI/MLをもっと導入すべき部分がいくつかあります。まず、数値モデルで計算された結果からより精度の高い局地的な気象データに翻訳する「ガイダンス技術」というのがあります。計算機が貧弱で数値天気予報の分解能が数100kmの時代に天気予報に使うために、気象技術者が観測データを使って統計的な関係式を求め、それをもとにある地点での気象予測を精度良く提供する仕組みです(下記)。

これは機械学習と同じことを必要に迫られて気象技術者が古くから実装していた手法なのです。この部分をさらに発展させるためには、最新のAI/ML技術を導入していくことが必要と考えられます。
気象モデルにおいても、たとえば、大変計算量の多い放射計算などをAI/MLに置き換えていくようなことはすでに取り組まれています。パラメタリゼーションという考え方自体、計算の対象とならない小さな現象の効果を、計算対象となる格子スケールの物理量から統計的に求める、というものなので、これも実は機械学習の考え方に近いのです。積雲対流のパラメタリゼーションなど、模式化した積乱雲を想定して簡単な物理モデルで積雲対流の効果を表現しようというもので、本当にザクッとした扱いであり、もっと観測統計に忠実な手法があれば、そちらに乗り換えてもよいはずです。物理過程にプログラムにあるチューニングパラメターをAI/MLで求めていく、というのがすぐにできそうなことかもしれません。
気象モデルとともに数値天気予報システムの基盤技術である、データ同化技術では、観測データを気象モデルの結果やさまざまな統計をもとに初期値に反映させます。これも、AI/MLの考え方そのものに近い技術です。
このように考えてみると、数値天気予報の技術は、中核の力学計算部分はともかく、そこに肉付けしていく部分の多くはAI/MLの世界でもっと最適化できるのではないか、という気もします。
世界の数値予報センターの最先端を行くECMWFが組織を上げて機械学習での予測に取り組んでいる背景なのかもしれません。10年後には天気予報は今とどう変わっているのでしょうか。意外と世の中の動きは早いのかもしれません。

この記事が気に入ったらサポートをしてみませんか?