NeurIPS 2023 Workshopのマテリアル関連の研究抜粋


はじめに

世界的に有名なAIの国際会議NeurIPSでAI for Accelerated Materials Design - NeurIPS 2023 Workshopというのがあるようです。
研究内容はpdfで公開されています。

AI x 材料周りの最先端の研究が発表されているので、色々と動向が気になるところです。
本記事では、個人的に、目についた研究をメモしていきます。
各記事は、30秒ほどしか読んでおりませんので、注意。

GPT-4によるデータマイニング(google)

GPT-4を使ってデータマイニングする研究。文献からバンドギャップを読み取るようです。
当然ながら、完璧ではないものの、従来法を上回る読み取り精度に。
AIのプロがマイニングしたらどの水準になるか、参考になります。

有機合成プロトコルのLLMによる解析(スイス連邦工科大学ローザンヌ校)

GPT-4で解析して、embeddingしている研究のようです。
まあこんなもんかな、という印象でした。

分子物性予測における因果関係の活用(オークリッジ国立研究所)

分子物性を予測するにあたり、説明変数間の階層性や因果関係を考える研究。
symbolic regressionなんかと相性が良いと思います。
解釈性と予測精度をあげる上で、おそらく重要な方向性という印象です。
手前味噌ながら、最近、GPT-4を使って変数間の因果関係を考えさせる研究を自分でもしました。

Diffusion modelでMOFを生成

画像生成で大成功したdiffusion modelを使って、分子構造(今回は水素吸蔵材料などで注目されるMOF)を作る研究?
個人的にも、こういうことをやったら面白そう、とは思っていましたが、余裕がありませんでした。

Diffusion model + LLMで無機材料の構造生成

言語モデルで電解液の物性予測

事前学習済みの言語モデルに回帰タスクをさせると、小規模データでもうまく行った、という感じの印象です。
方向性としては有りですが、今後は単なる数値の予測以上のことを、言語モデルを使ってできるようになれると面白いと個人的には思います。

グラフ構造からのテキスト生成(高分子)

traditionalな変分オートエンコーダーの系譜の研究、という印象でした。

NMR+言語モデル

https://openreview.net/pdf?id=akFqQokObE

NMRからtransformerを使って分子構造を同定する試みのようです。


所感

予想通り、大規模言語モデルを使った研究が目立ちました。
ちょっと前までは、グラフニューラルネットワークやオートエンコーダを分子物性予測に組み合わせる研究が趨勢を占めていました。
その界隈の人々が、大規模言語モデルに移っている印象です。

大規模言語モデルは、従来の特化型システムとは異なり、種々のデータを多量に学習しているので、予測の汎化性能や信頼性が上がる可能性があります。
ただ、多くの用途の実用水準(?)まで高められるかは、まだわからない状況※かと思います。
(※ 10^23個程度の分子の集まり(≒変数自由度)の挙動を理解・予測するのは、本質的に極めて困難な営みで、どこかに限界点があるはずです)

加えて、多くの計算化学+AI研究者がこの領域に参入済みなので、レッドオーシャン化しつつある雰囲気を感じました(とは言え、日本人研究者の発表が殆い無いというか、皆無?な雰囲気なのは残念なことではありますが)。

個人的には、もう少し時間のながれがゆっくりな領域(≒webデータだけでは簡潔しない研究≒実験系)を絡めながら研究を展開していきたいと思います。


この記事が気に入ったらサポートをしてみませんか?