見出し画像

自身の自信

原子間相互作用におけるポテンシャルエネルギー面を予測する機械学習(ML)力場において、不確かさの定量化(UQ)は非常に重要な要素である。しかし、アンサンブル法、ドロップアウト法、デルタ法などの従来のUQ手法には、高い計算コストや信頼性の低い校正不確かさ推定などの限界がある。論文「Robust and scalable uncertainty estimation with conformal prediction for machine-learned interatomic potentials」では、ML力場によって予測されるエネルギーの不確かさを推定するために、共形予測(CP)と潜在距離に基づく新しいUQ法を提案している。

CP法は、誤差分布が正規分布であることを仮定しない無分布UQ法である。これは不確かさを推定するために分位点回帰を使用し、有限サンプルカバレッジが保証されているという利点がある。本研究では、著者らは、ニューラルネットワークの潜在空間におけるユークリッド距離を、発見的不確実性メトリックとして用いる。潜在空間距離は、ニューラルネットワークの最終層の潜在空間における画像単位の表現を計算し、テストデータ点とその学習データからのk近傍のユークリッド距離を求めることにより算出される。

著者は3つのベンチマークデータセットで6つの異なるUQ法を比較し、CP法がその中で最も較正が良く、シャープであることを発見した。また、CP法は信頼度、最近傍の数、キャリブレーションデータのパーセントなどのハイパーパラメータに比較的影響を受けにくかった。これらのパラメータの推奨デフォルト値は、それぞれ10と10%であることがわかった。また、CP法は、グラフニューラルネットワークを含む事前学習済みのニューラルネットワークモデルに対して拡張性と移植性があり、他のUQ法と比較して計算コストが比較的低いことがわかった。

また、CP法は、能動学習スキームにおいてデータが多いほど精度と信頼度が向上し、分布内データに比べ分布外データでは不確実性が高く、能動学習スキームにおける有望な手法であることがわかった。しかし、CP法は独立同分布(i.i.d)データの仮定に違反すると較正できない可能性があり、また、特定の原子に関連した不確実性を直接推定する方法を提供しない。

以上のことから、CP+latent法はML力場の不確かさを予測するための堅牢でスケーラブルなルートであり、学習済みのニューラルネットワークモデルに容易に適用することができる。また、CP法は、他のUQ法で推定された不確かさを校正するための有望な戦略であり、力場構築や物質探索における能動学習スキームに関連するツールである。

この記事が気に入ったらサポートをしてみませんか?