数学の難問を解くAI~DeepMindが導く新しいAIの姿
ChatGPTなど生成AIが世に出て、世界中でその認知度はかなり高くなっている。ChatGPTは、質問をすると回答してくれる。Stable Diffusionはテキストで命令を出すと、画像を作成してくれる。Stable Video 4Dにいたっては、動画まで作成してくれる。
そんな生成AIが世に出るよりもずっと前から存在する、1つのAIがあることは、あまり知られていないだろう。DeepMind(現Google DeepMind)が開発した「AlphaGo」だ。
生成AIと異なり、命令なく自分で考えるAIといえばいいかもしれない。AlphaGoはその名が示す通り、たゆまぬ練習を通じて超人的なスキルで囲碁をプレイすることを学んだ囲碁AI。2016年に登場したAlphaGoが元囲碁世界チャンピオンであるイ・セドル氏と対戦して勝ち越したことを覚えている人はいるのではないか。
AlphaGoはディープラーニングを活用したことで従来の囲碁AIより飛躍的に強くなったが、2016年当時はまだ過去の棋譜を学習データとして活用していたという点では、人間の棋士が学習することと大差なかった。
そこでDeepMindは、2017年に過去の棋譜を用いずにセルフプレイによってのみ学習するAlphaGo Zeroを開発、AlphaGo Zeroをチェスと将棋にも対応させたAlphaZeroを発表した。
AlphaZeroは、学習データなしで世界最強クラスのチェスや将棋のプログラムに勝利するまでに成長。このような話をすると「ゲームに勝つためのAI」と見られがちだが、AlphaZeroはチェスや将棋、あるいは囲碁で最強となる以上の可能性がある。
現実の世界における広範囲な問題を解決できる知的システムを作るためには、そうしたシステムが新しい解決策を見つけられるように柔軟かつ汎用的であることが求められる。こうした汎用知的システムを開発するというゴールに至るには、まだいくつかの進歩が必要だ。進歩して解決すべき問題として、知的システムは特定のスキルを高い水準で習得することはできるが、ほんの少しだけ変更されたタスクが提示されただけでしばしば失敗してしまう、ということがある。
3つの異なった複雑なゲームを習得したAlphaZeroの能力は、以上のような問題を克服するための重要なステップだ。AlphaZeroは、単一のアルゴリズムが設定された範囲内で新しい知識を発見する方法を学べることを証明している。
現在、Google DeepMindは「AlphaZero」の能力とLLM(大規模言語モデル)の能力を組み合わせることで、非常に難しい数学の照明を解決しようとしている。それを実現するために開発されたAIが「AlphaProof」だ。
AlphaProofはグーグルのLLMである「Gemini」を利用することで、自然な言葉で表現された数学の問題を「Lean」という形式言語に変換する。これに基づいて2番目のアルゴリズムが試行錯誤し、正しいと確認できる証明を見つける方法を学習するための訓練用データが提供される仕組みだ。形式言語は、数学的推論を伴う証明の正しさを形式的に検証できるという重要な利点がある。
しかし、機械学習における形式言語の使用は、これまで、利用可能な人間が書いたデータの量が非常に限られているという制約があった。
対照的に、自然言語ベースのアプローチは、桁違いに多くのデータにアクセスできるにもかかわらず、もっともらしいが誤った中間推論ステップとソリューションを幻覚的に提示する可能性がある。そこで、自然言語の問題ステートメントを正式なステートメントに自動的に翻訳する「Gemini」をファインチューニングし、さまざまな難易度の正式な問題の大規模なライブラリを作成することで、これら2つの補完的な領域の間に橋を架けるというアプローチが斬新に思える。驚くことに、Google DeepMindは、言語モデルとは異なるAIのアプローチを組み合わせた別の数学アルゴリズム「AlphaGeometry」も発表していう。AlphaGeometryはGeminiを用いることで、幾何学的要素を扱うプログラムによって幾何学の問題を操作とテストが可能な形式に変換することができる。
AlphaProofとAlphaGeometryの2つの数学プログラムはすでに実用レベルの仕上がりなのだ。例えば、AlphaGeometryは国際数学オリンピック(IMO)の幾何学問題30問のうち、25問を制限時間で解いたそう。IMOは1959年から毎年開催されている若手数学者のためのコンテストで、IMOの代表には、数学に関する賞としては最高の権威を有するフィールズ賞の受賞者も多くいる。性能の高さを実証するために、Google DeepMindは、AlphaGeometryのアップグレード版のAlphaGeometry2とAlphaProofを統合したAIシステムにIMOが提供した競技問題を解かせ、IMOの金メダリストでフィールズ賞受賞者のティモシー・ガワーズ教授と、金メダルを2回獲得したジョセフ・マイヤーズ博士に採点してもらったそうだ。
問題は、システムが理解できるように手動で翻訳する必要はあったが、2024年のIMOの出題6問のうち、1つの問題は数分以内に解けたものの、他の問題を解くのには最大3日かかった問題もあったということ。2024年のIMOでの最高得点は42ポイントなのに対して、DeepMindのシステムは6問中4問を解くことができ、スコアは28ポイントを獲得。このスコアは銀メダルの最高点に相当する。金メダルの基準は29ポイント以上で、公式大会では609人の参加者中、58人がこのポイントを獲得しており、日本からも6人が出場、2人が金メダルを獲得している。
今まで数学のような学問分野はAIが苦手とする分野と思われていた。過去のデータを学習するタイプでは「新しい気づき」を導くことができないと思われていたからだ。実際に、世にある多くのAIは過去のデータを参照する、インプットされたデータを引用することが多いので、エンジニアが与えたデータ以上のことを考え算出することはできなかったといえる。
AlphaProofのような「変化したデータにも対応できるAI」の出現は、これまで停滞していた諸問題の解決に貢献すると期待できる。「AIが進歩すれば人間を凌駕する」という印象はあるが、決して人間が不要になるわけではない。
AlphaProofやAlphaGeometryは難解な数学の問題を解決できる可能性を秘めているが、「問題を見つける」ことはできないのだ。
数学の研究はまず「問題を見つける」ことから始まる。
その問題にどのような意味があるのかは。その場では分からない問題も多々ある。もし、AIが問題を見つけられるほど進歩したとしても、その問題に意味があると判断できなければ、見逃す可能性がある。しかし、数学者はどのような問題にも「意味がある」と信じて採用する。数学に関わりのない人から見ると、無駄に見えるこの思考パターンが非常に重要だと僕は思う。
1995年にフェルマーの最終定理したアンドリュー・ワイルズも友人宅で「ケン・リベットが、志村-谷山予想とフェルマーの最終定理のつながりを証明した」という話を聞かなければ証明できなかったかもしれない。それまで無関係に存在していた「志村-谷山予想」と「フェルマーの最終定理」をつなげたのはケン・リベットという人間の数学者だ。これはAIにはできない業績だと思う。
AIは人間を凌駕するものではなく、人間を助けてくれる頼もしいパートナーという認識が正しいのではないだろうか。数学者がAIツールを使用して仮説を探求し、長年の課題を解決するための大胆な新しいアプローチを試し、証明の時間のかかる要素を迅速に完了する未来、そして、AI システムが数学とより広範な推論においてより有能になる未来に期待している。未解決の過去の遺産をAIと共に解決する日が近くまできているのかもしれない。