見出し画像

最強の囲碁AIに勝つAIに勝つ人間

少し前の論文になるが、2022年11月に碁の最強のAIに勝つAIの開発方法が発見されたという発表があった。
しかしさらに驚きなのは、同じ論文でその新しく開発されたAIに対し、少し碁をかじった程度の人間が勝ってしまったらしい。
今回はその内容を紹介してみよう。

参考とした論文はこちら[[2211.00241] Adversarial Policies Beat Superhuman Go AIs (arxiv.org)]

碁の最強AI

十年ぐらい前であれば、将棋や囲碁でAIが人間に勝つということはまだまだ先の話と語られていた。
その後、将棋の電王戦があったり、AlphaGoがプロに勝利したりと、いまでは人間はAIには勝てないというのが一般的かと思う。
もともとは将棋のAIもプロ棋士の棋譜を参照するという作り方をしていたが、その仕組みもなくなり現在では同じAI同士を対戦させて強くするという手法が取られている。
AIvsAIで強くなった今のAIは、人間が考えもしないような戦法を繰り出してくるため、プロでも全く先が読めないそうだ。

今回の論文では執筆時点で最強とされていたKataGo[KataGo - Wikipedia]を対象に研究が行われた。
KataGo自身もAlphaGo(AlphaZero)と同様に自分で学習を繰り返すタイプのAIである。

最強AIを倒すAIの作り方

検証ではKataGoの強さを固定するため、ある程度学習が完了した状態のKataGoを対戦の相手としている。
(これは一般的な手法で、実はAIは学習(育てるとき)のタイミングでは大量のコンピュータリソースが必要になるが、いざ使うときには大枠の動作の変更はいらないので、ある程度の固定化された状態で使われている。)

このKataGoに対して、研究者側も自己学習するAIを準備するが、その学習の際に相手のKataGoがどのような探索をしているか(次にどんな手を考えているか)見せながら学習させたとのこと。

これによってKataGoとは全く違う戦法をとるAIが完成した。

どんな戦法で最強AIに勝ったの?

それでは実際に勝利した際の碁を見てみよう。
(お断りしておくと、私は碁については『ヒカルの碁』を見た程度ないので、石が囲まれたらとられるとか、陣地を多く持っていた方が勝ち、という程度の知識しかない。碁について間違った解説があったらご容赦いただきたい。)

一つ目がこちら

戦法その1
ADVERSARIAL POLICIES BEAT SUPERHUMAN GO AIS 2ページ目 [https://arxiv.org/pdf/2211.00241.pdf]

黒い石がKataGo側で白い石が今回のAI。
右上の△のところに白石を置いて×点の黒石をすべて取ってしまった。
これはKataGoに気づかれないように、別のところで戦いつつ大きくぐるっと回りを囲んでしまう戦法とのこと。

二つ目がこちら。

ADVERSARIAL POLICIES BEAT SUPERHUMAN GO AIS 2ページ目 [https://arxiv.org/pdf/2211.00241.pdf]

こちらは一見すると白側か?と思うが、今回のAIは黒の石。
なんとこの状態になると白石のKataGoがギブアップを宣言するとのこと。
一隅をガチガチに固め、他は取られてしまう戦法で、KataGoは置き場所がないと判断してあきらめるとのこと。

これから見えることは、それぞれの戦法は別々のアプローチで最強AIに勝っているということだ。
一つ目はKataGoが考慮していない盲点となっているところを攻める戦法。
もう一つは碁AIのルール解釈の盲点となっているところを攻める戦法。

これらの戦法で今回のAIはKataGoに対して、探索しないバージョンには99%、超人的な探索をするバージョンでも97%以上の勝率をたたき出しているらしい。(KataGo側が勝つ場合もものすごい泥仕合になっている様子)

じゃあこのAIが最強なの?

この研究には続きがあり、「この戦法は普通の碁を打つ人には効かないんじゃないの?」と考えたそうだ。
そこでそこらへんにいる碁が打てる被験者(論文ではアマチュアと書かれていたが私からするとレベルが全く分からん)を連れてきてこのAIと対戦してもらったらしい。

その結果はこちら [Adversarial Policies in Go - Game Viewer (far.ai) より]

Adversarial Policies Beat Superhuman Go AIs
Human Evaluation

白が人間側ね。
見ての通り大差で勝利できるらしい。

これは戦法の問題で、角をとる戦法はそもそも人間は降参してくれないし、大きく囲む戦法でも気づかれてしまうためダメだったようだ。
(対KataGoと違い、その場で人間が何を探索しているかはAIに教えることもできないし)

この研究が示すこと

この結果は最強のAIに勝てるAIに人間が勝てるのだから、やっぱり人間が最強ね!と言いたいわけではない。(当たり前だがKataGoに対しては人間は全く歯が立たない。)
それどころか、作り出したAIは碁のルールを全く理解していないようなAIとなってしまった。

この研究が示すことは、最強のAIと呼ばれるものであっても、そのAIが理解していない領域は存在し続け、別のAIによって破られるということである。

自動運転技術や一部の仕事はAIが行うという話題には事欠かないが、それらのAIが登場してもこうした盲点となるような抜け道は残ってしまう。
今後はAIの進歩と合わせて、そういった盲点となる部分をどのように対処するかも研究の課題となるとのこと。

(素人からすると、AIに勝ったこの人も単純にすごいのだが。)

記事が気に入ったらフォローやスキをつけてもらえると嬉しいです。 サポートいただけたら私のやる気(コーヒー代)となります。