成田空港の霧予測
気象予報士である私が、データサイエンスを始めて早1年半が過ぎました。その結果、生活も働き方も大きく変えることになり、こうしてブログを書いているのも、その変化の1つと言えます。
さて、先日11/25朝に関東地方で大規模な濃霧が発生し、成田空港はもとより、めったに霧が出ない羽田空港すらも濃霧に包まれました。
それで思い出したのが、AIを使った成田空港の霧予測について第13回航空気象研究会(気象学会の専門分科会の1つ)で発表したことです。その時のスライドがこちらです。
この研究は、データミックス社のデータサイエンティスト育成講座の卒業課題として取り組んだものを、2019年の航空気象研究会で発表するためにバージョンアップしたものです。
成田空港の霧、というテーマを選んだ理由はいくつかあります。
(1)航空気象が好きで、エアラインで運航管理の仕事をしていた経験もあり、実際に成田空港の霧は重要な予測テーマであった
(2)必要なデータは持っていた、ないし入手可能であり、学んだばかりの統計モデリングや機械学習を試すのに適していた
(3)気象のドメイン知識を活かしたモデリングがやりやすかった
特に3番目がポイントになります。一般に霧は大気が飽和、すなわち相対湿度100%になることで発生しますが、データを見る限り湿度100%になっても必ずしも霧が発生しない場合も多いです。つまり、湿度だけに依存した予測をすると空振りが多く発生します。気象予測にとって、空振りの多発はオオカミ少年のごとく信頼性を失う結果となり、できるだけ避けたいというモチベーションがあります。
そこで霧の発生メカニズム(概念モデル)に基づいて特徴量を設計し、機械学習を使えば精度よく予測できるのではないか、と考えました。そして、それはある程度成功したと思っています。
スライドで示した通り、Elastic Net / Deep Learning の両方で、湿度よりも大気の安定度の方が霧の発生予測により大きく寄与するという結果となりました。霧の発生には、湿度が高いという条件の他に、大気の状態が穏やかで撹乱されにくい安定した状態という条件もあります。その後者の条件の方が、予測の上では重要という解析結果となりました。
この結果は気象予測の現場を長く経験した私の感覚とも合います。そしておそらく、気象のドメイン知識を持たないデータサイエンティストが、大気の安定度を特徴量として見出すことは至難の技です。
気象予報士がデータサイエンティストとしても仕事をする意義を、多少なりとも確認できた良い機会でした。この研究は純粋な気象予測がテーマでしたが、気象ビジネスにおいても2つのスキルの掛け合わせで価値を出していきたいと思います。
最後までお読みいただき、ありがとうございました。
この記事が気に入ったらサポートをしてみませんか?