見出し画像

囲碁雑記:技倆(ぎりょう)と哲学とAI

渡辺貞一(NPO法人 広域連携医療福祉システム支援機構)

囲碁:習い始めのころ


 碁を覚えたのは中学生のころである.実家の近くに,先代の本因坊秀哉の弟子で,すでに引退されていたが,専門棋士の鹿間千代治七段が住んでおられた.この先生に1年近く碁を教えていただいたことがある.

 碁を習うといっても,月に2回自宅へ伺い,打っていただくだけであるが,碁の面白さが少し分かりかけていたころで,熱心に通った.当時,先生は,すでに高齢であったが,まだまだかくしゃくとされており,碁は若々しくかつ厳しかった.

 自分なりに勉強して出かけていき,一局打ってもらって,その後手直しをしていただくわけであるが,悪い手を打つと扇子が飛んでくることがあり,ピンと張りつめた空気の中で,一局一局を工夫しながら真剣に打ち,基本を教わった.

 1年足らずの短い期間であったが,碁の基礎を習い,型を知り,急速に置石が少なくなっていった.そして強くなるにつれて,プロの恐ろしさ,深い読みに裏づけされた強さを骨身にしみて知るようになった.

 碁のルールはきわめて簡単である.単純な「石の生き死」のルールに立脚して,地を取り合い,一目でも多ければ勝つ.習い始めのころは,自分の打った碁が頭に入らないが,少し強くなると不思議に頭に残り,後で並べられるようになる.そして石の姿や形ができてくる.

 専門家の碁は美しい.自然な石の流れと姿があり,それに個性が色濃く滲みでている.

 多くの専門家は,生来才能豊かであり,その上,院生や内弟子時代を通じて技術を磨き,厳しい生存をかけた修行を重ねている.

 このプロと呼ばれる人たちの技倆ぎりょうは,我々から見るとほとんど差がなく同じに見える.部分的な型,手筋などは一目見れば分かり,多くの場合,数十手先を瞬時に読むことができる.自分が打った碁はもちろん,他人の碁も忘れずに何年も覚えている人が多い.

 プロとアマの差も,ほとんどこの基本の差にあるといえる.プロの碁は,基本がしっかりしている上に,試合を通じて筋金,泣きが入っているため,容易に崩れないのである.

 しかし,碁は広く深いもので,卓越した技術を持つ専門家でも,技倆ぎりょうだけでは,一流になれないのである.一流といわれる専門家の碁には,思想があり個性豊かな構想があると思う.碁はこの構想の戦いであり,思想の大きさ,考えの深さが,一流になれるか否かを決めているように思う.

 彼らは,構想,石の一貫性,そしてリズムを大切にする.石の姿,形が美しいだけでなく,石の連なりを通して,考えを主張し,問いかけてくる.強くなれば,微妙な彼らの声がよく聞こえ,その思いに反応し,共鳴できるところが多くなるように思う.

 囲碁は,高い技倆ぎりょうを競うゲームであるが,同時に思想や哲学を深め人間性を高める修行の場でもある.鹿間先生に教わったころは,修行としての“道”の意味合いが,強くあったように思う.

大枝雄介9段を知る


 囲碁は,長らく疎遠であった.

 関心はあったが,時間がなく,テレビの囲碁番組や新聞の囲碁欄を見る程度であった.それがふとした縁で,日本棋院のプロ棋士の大枝雄介9段と知り合い,個人指導を受けることになった.囲碁の好きな仲間4人を誘って,月1回休日に都内の個人宅で,打っていただくことになった.

 大枝先生は,当時はまだ7段であったが才能豊かな正統派の棋士で,日本
棋院の役員もされていた.

 囲碁は,2面,3面打ちで,教えていただいた.レッスンを重ねるうちに,少しずつ碁の考え方や構想,型,技倆ぎりょうを学び,置き石が少なくなり,形ができてきたように思った.碁は型ができてくると,石の働きが良くなり容易に崩れなくなる.

 置き石が,少しずつ減って3子になったが,3子ではきつく,逆コミを3〜5目もらって打っていた.あるとき,対で打とうと言われ対戦したが,50手ほどで潰された記憶がある.

 先生は,そのころから内弟子を取り始めていた.自宅に行くと,棋士になる前の院生や低段者の少年が大勢いた.外国からの若者も大勢いた.後に活躍する,マイケル・レドモンド,柳時薫,楊嘉源などや,女性棋士の万波佳奈,奈穂姉妹もいた.

 四谷にある木谷道場にも誘われて出かけた.大竹名人を塾頭に若い石田,加藤,趙,小林,武宮など,後に名人や本因坊などになる有名棋士が大勢いた.

 躾は厳しく,人間形成の修行の場でもあった.生来才能の豊かな棋士の卵が切磋琢磨し,ここからタイトルを取る世界のトップ棋士が生まれていった.

 しかし,時代とともに,このような内弟子制度は少なくなった.

 日本棋院には,外国から囲碁愛好者が,毎年勉強のため大勢やってくる.プロの棋士に直接教わるため,また日本文化に触れるために休みを利用してやってくる.

 その中で,ニューヨークから夏休みに来て1カ月あまり滞在していた弁護士がいた.先生たちの紹介で,この人と打つことになった.

 打ち始めると,先生たちが棋譜をとり始めた.日本棋院が発行する囲碁雑誌「棋道」に載せるためという.ただし米国人が勝ったときということであった.

 棋力は互角のようで,形の綺麗な強い打ち手であった.

 大枝先生を通して,多くのプロ棋士と知り合いになった.プロ棋士と打つと,石の死活や型や手筋は具体的で有益であるが,そのほかに,無形の感覚も大切であると思った.

 プロと打つと次の一手はここで,ここ以外はないと感じる大局的な感覚である.この感覚は,多くの棋士に共通していて,これを体得できると,棋力は一段と向上するように思う.見えにくいプロの強さの源泉のように思った.

 試合の後は,問題の手の指摘や石の方向などを手直ししてもらった.

 ただ,帰り道などで,記憶の中,あの局面では,キリを入れた方がよいとか,伸びるとよかったなどと指摘されると,ついていくのが大変であった.

 プロ棋士は,負けることが生来嫌いである.指導碁でも形勢が悪くなると,読みを外した勝負手を打ってくる.手はいろいろあるようで,これを乗り越えないとアマの高段者になれないように思う.

囲碁AI


 人工知能AIが進化して,社会も囲碁も大きく変わった.

 囲碁は,最も奥が深く,長らく攻略は難しいと考えられてきたが,2016年にそれを変える大きな出来事があった.

 米国のGoogle系のDeepMind社が開発した「アルファ碁(AlphaGo)」が,世界のトップ棋士“李世ドル氏”に,4勝1敗で勝ち,またその翌年,世界最強といわれた棋士“柯潔氏”に3連勝して,囲碁AIがトッププロを超えたと見なされるようになった.

 囲碁AIには,人間の考えや価値観に近いところと,遠く理解を超えた不思議なところがある.

 囲碁AIは,技術の観点から見ると,3つの中心となる技術があると思う.

 1つは,直感力に相当するディープラーニング技術で,“畳み込みニューラルネットワークCNN”が使われている.このCNNは,2種類あり,次の1手を確率で表すポリシーネットワークと局面の良さを評価するバリューネットワークがある.いずれも10数層の階層からなるNNである.

 2つ目の強化学習技術は,次の1手を行うポリシーネットワークを強化する学習で,少しずつパラメータを方策勾配法により更新する強化学習である.自己対戦を繰り返し強化学習する.

 3つ目のモンテカルロ木探索技術は,打つ手を先読みする技術である.候補となる木を深く探索する場合,勝率の高い枝を選ぶが,試行回数が少ないときは幅を広げて低い枝も加えるという手法を用いて,子ノードを選択して終局まで進める方法である.

 アルファ碁は,これらの3種の技術を統合して,囲碁AIを作り上げている.

 最初は,強い打ち手の膨大な棋譜を学習する.

 使用した棋譜データは,高段者の棋譜16万局分で,局面に直すと,一局の手数は200手程度なので,3,000万個の学習データである.これに棋譜の対称性(回転や反転)を考慮して,この8倍の2億4千万個の学習データを得ている.学習は,NNの出力と人間の手が,できるだけ一致するように,各層のフィルタの重みを,誤差逆伝播法を用いて修正している.

 その後は自己対局を繰り返し,強いアルファ碁を作り上げていて,囲碁対局サイトで,60勝0敗と人間を圧倒する成績を上げた.

 コンピュータによる計算は,1,202個のCPUと176個のGPUが協調して行っている.

 強さを表す指標に,イロレーティングがある.ハンガリーの数学者Eloが考案した指標で,勝敗比を対数に変換したものである.

 アルファ碁が最初に対戦した欧州のチャンピオンのフイ2段が,2,908点(固定)で,それを基準にレーティングが決められている.囲碁の高段者は,3,000点台前半で,世界ランク1位の囲碁棋士,柯潔氏は3,600〜3,700点程度と言われている.

 アルファ碁AI技術の詳細は,2016年1月にNatureに発表された論文 “Mastering the game of Go with deep neural networks and tree search”に詳しく記載されている.

 このアルファ碁は,その後大きく改良され,人間の知識を用いない,教師なしの「アルファ碁ゼロ(AlphaGo Zero)」を開発した.

 アルファ碁ゼロは,囲碁の基本ルール,すなわち碁盤に黒番,白番が順番に石を置いていく,相手の石を囲ったら取れる,地が多い方が勝ちなどのルールのみから,自己対局を始め,強化学習を繰り返し,イロレーティングがマイナスのレベルから,1日後にはプロレベル3,000点に到達し,3日後には,アルファ碁を超える高いレベル4,000点に到達したと報告されている.

 このアルファ碁は,目標を達成したとして開発を終了したが,囲碁AIとして,いろいろな囲碁ソフトウェアが開発され普及している.

 この中には,打った手を評価し,より良い手を見つける検討用のソフトがあり,専門棋士はこれを研究用に使って棋力の向上を図っている.従来の勉強法とは大きく異なり,新手や新しい考え方,戦略が次々と登場し,囲碁は大きな変革期を迎えている.

AIと人間


 長い年月をかけて築き上げてきた“人間の囲碁”と人工知能と結びついた“囲碁AI”について,体験を交えて触れてみた.

 AIは,このアルゴリズムがはっきりしない囲碁の分野に挑戦を続けてきた.そして3つの基本技術と強力な計算力で,攻略の糸口をつかみ,人間を凌駕するようになった.

 囲碁AIの研究には,GoogleやFacebook,中国のTencentなどの大手企業も参加し,AI研究の1つの応用分野として力を入れてきた.

 彼らは,ここで開発した深層学習や強化学習,探索などのAIの基本技術は,ロボットや自動運転,医療,宇宙産業などの広い分野に活かせると考え参加している.

 しかし同時に,AI技術は危険な要素をはらんでいるので,研究や活用には,十分なコントロールが必要であると思う.

 AIが,常に人類に益をもたらし,害を及ぼさないような仕組みとその構築も必要である.

 これには,人間の叡智を集結した集合知で達成できればよいが,恐らく十分でないだろう.AIの進歩を踏まえ,高いレーティングを持つ親和性のあるAIを開発し,これを協力者として実効性のある枠組みを作り上げる工夫も,また同時に必要になると考えている.

 AIは諸刃の刃であるが,高度なAIから人智を超えた優れた案が出てくるかもしれない.地球規模の難題や人類の存続にかかわる課題の解決に,高度で良質なAIが役立つことを願っている.

■渡辺貞一
1962年,京都大学理学部物理学科卒業,東芝入社,総合研究所他で,パターン認識,画像処理などの研究開発に従事,情報通信システム研究所他の所長,1998年福井大学情報工学科教授,現在NPO法人広域連携医療福祉システム支援機構副理事長,IEEE Life Fellow.


(2022年4月21日受付)
(2022年4月27日note公開)