見出し画像

Large Language Models as Master Key: Unlocking the Secrets of Materials Science with GPT

本稿では、材料科学におけるデバイスレベルでの情報抽出の複雑さに対処するために、構造化情報推論(SII)と呼ばれる新しいNLPタスクを紹介する。このタスクは、既存のペロブスカイト太陽電池FAIR(Findable, Accessible, Interoperable, Reusable)データセット(F1スコア91.8)にGPT-3をチューニングし、データセットを現在までのすべての関連科学論文で更新することによって達成した。作成されたデータセットはフォーマット化、正規化されており、その後のデータ解析の入力として直接利用することが可能です。この機能により、材料科学者は、自分の領域で質の高いレビュー論文を選択することで、独自のモデルを開発することができるようになります。さらに、太陽電池の電気的性能を予測する実験を行い、LLMを通じて材料遺伝子とFAIRの両方のデータセットでパラメーターを逆予測することを計画した。特徴選択を行わない従来の機械学習法と同等の性能が得られたことから、大規模言語モデルが材料科学者のように材料を判定し、新材料を設計する可能性を示している。

この記事が気に入ったらサポートをしてみませんか?