見出し画像

デミス・ハサビス AlphaGo

デミス・ハサビス 人工知能研究者、神経科学者

デミス・ハサビス (Demis Hassabis, 1976年7月27日-)はイギリスの人工知能研究者、神経科学者(脳科学者)、 コンピュータゲームデザイナー、世界的なゲームプレイヤーである。

デミス・ハサビスは北ロンドンで生まれ育った。彼はギリシャ系キプロス人と中国系シンガポール人の家系である。
チェスの神童で、ハサビスが13歳の時のイロレーティングは2300で(当時14歳以下のプレイヤーの中ではユディット・ポルガーの2335に次いで世界で2番目に高かった)、イングランドジュニアチェスチームのキャプテンを務めた。
神経科学ハサビスはビデオゲーム開発を離れ、AIの新しいアルゴリズムのアイデアのインスピレーションを脳から得るために認知神経科学へ切り替えた。
自伝的記憶(en:Autobiographical memory)と記憶喪失の分野で活動し、何本かの影響力のある論文を執筆した。

現在、ハサビスがPNASで発表した「海馬損傷を有する患者は記憶喪失を引き起こすことが知られているが、彼らは新しい体験の中に自分自身を想像できない」とする論文が最も引用頻度が高い。

重要なのは、このことが想像の構築過程とエピソード記憶の想起の再構成過程とが関連すると実証した点である。

これらの発見とfMRIによるフォローアップ研究に基づき、ハサビスはエピソード記憶システムが情景の構築を識別する新しい理論的説明を展開した。
すなわち、複雑かつ理路整然とした情景の生成とそれを持続させ続けることが、想起と想像の根本的プロセスの鍵となる。この仕事は主要メディアで広く取り扱われ、サイエンス誌は2007年の10大ブレイクスルーの一つに(第9位として)選んだ。

近年、ハサビスの発見と解釈は他の研究者達の挑戦を受けている。 Larry R. Squireらの論文[18]は海馬病変と想像力欠損の間の乖離だけではなく、記憶喪失と想像力欠損の乖離を報告した。さらにSquireらは、ハサビスらの試験対象である患者の病変は海馬に限定されていたかどうか疑問視した。議論は進行中であるが、最近の研究は元の発見を支持している。

DeepMind2010年、ロンドンを拠点とする汎用学習アルゴリズムの構築に特化した機械学習のスタートアップであるDeepMindテクノロジーズを共同で立ち上げCEOを務めた。

2014年1月にDeepMindはGoogleに4億ポンド(約6億2500万ドル)で買収され、ハサビスは一般的なAIプロジェクトを指導するエンジニアリング担当副社長となった。
2015年10月、DeepMindのAlphaGoプログラムは、ヨーロッパ囲碁チャンピオンを打ち倒しAIのブレイクスルーを達成した 。2016年3月には、世界最高ランクの囲碁棋士である李世乭に5試合中4試合に勝利した。

Google DeepMindによって開発されたコンピュータ囲碁プログラムである。
2015年10月に、人間のプロ囲碁棋士を互先(ハンディキャップなし)で破った初のコンピュータ囲碁プログラムとなった。2016年3月15日には、李世乭との五番勝負で3勝(最終的に4勝1敗)を挙げ、韓国棋院に(プロとしての)名誉九段を授与された。また、2017年5月には、柯潔との三番勝負で3局全勝を挙げ、中国囲棋協会にプロの名誉九段を授与された。Google DeepMindは世界トップ棋士である柯潔に勝利したことを機に、AlphaGoを人間との対局から引退させると発表した。

コンピュータが人間に打ち勝つことが最も難しいと考えられてきた分野である囲碁において、人工知能が勝利を収めたことは世界に衝撃をもたらした。AlphaGoの登場は単なる一競技の勝敗を越え、人工知能の有用性を広く知らしめるものとなり、世界的AIブームを呼び起こすきっかけともなった。

囲碁は創造的、戦略的思考を必要とする複雑なボードゲームであり、長い間、囲碁は、チェスのようなその他のゲームと比較して人間に勝つのがコンピュータにとってはるかに困難であると考えられていた。
これは、他のボードゲームよりも可能な局面の数がはるかに大きい(約2×10170通り)ため、力まかせ探索といった伝統的なAI手法にとって極めて困難なためであった。
2015年より前は、最良の囲碁プログラムはアマチュアの有段レベルに達するのがやっとであった。小さな9路盤(9×9)ではコンピュータは健闘し、一部のプログラムはプロ棋士に対して9路盤で互角に戦うだけの力があったが、19路盤ではプロ棋士に太刀打ちできていなかった。
IBMのコンピュータディープ・ブルーがチェス世界チャンピオンガルリ・カスパロフを1997年に破った後、囲碁が人間のアマチュアの強さに達するまでにほぼ20年を要した。
人工知能の分野における多くの人々も、囲碁はチェスよりも人間の思考を模倣するためにより多くの要素を必要とすると考えていた。

AlphaGoはそれ以前のAIの取り組みとはニューラルネットワークを応用している点において最も大きく異なっている。
ニューラルネットワークでは、評価経験則が人間によってハードコードされておらず、代わりにプログラム自身によって自分自身との対局を数千万回繰り返すことによってかなりの程度まで学ぶ。
AlphaGoの開発チームでさえ、AlphaGoがどのように石の配置を評価し次の手を選択しているかを指摘することはできない。モンテカルロ木探索もプログラムの推論効率を改善するための主要な方法として用いられている。
AlphaGoは、それ以前の囲碁プログラムから著しい発展を遂げた。その他の利用可能な囲碁プログラムと対局した500局で、AlphaGoは1局しか負けなかった。

2015年10月、ヨーロッパチャンピオンに勝利。さらに2016年3月には世界戦で18回優勝の経験のあるトップ棋士・李世乭九段(韓国)に4勝1敗と勝ち越す。そして2017年5月にはレーティングで当時世界トップ棋士だった中国の柯潔九段に3連勝を果たし、人類との対局から引退した。

2017年10月18日、過去の試合データを使わず、ビッグデータ不要で自己対局のみでスキルアップする新囲碁AI「AlphaGo Zero」を発表した。生まれてから40日後には、5月に世界最強棋士、柯潔九段を破った「AlphaGo Master」に完勝した。

2017年12月5日、AlphaGo Zeroのアプローチを汎化させ、囲碁以外のゲームにも対応できるようになったAlphaZeroを発表した。AlphaZeroは5000台のTPUを使用し、AlphaGo Zeroを8時間の学習で上回った。

人間との対局樊麾との対局
樊麾対AlphaGo – 第5局AlphaGoは2015年10月に、ヨーロッパ王者の樊麾を5-0で破った。AIがプロレベルの人間にハンディキャップなしの19路盤で破ったのはこれが初めてであった。一部の解説者は樊麾と李世乭(プロ九段)との間の実力の差を強調した。コンピュータプログラムのZenとCrazy Stoneはこれ以前に九段のプロ棋士を4子のハンディキャップ付きで破っていた。

カナダのAI専門家ジョナサン・シェーファー(英語版)は、樊との対局後にAlphaGoを未熟な「神童」と論評し、「プログラム(AlphaGo)が真にトップの棋士と対局した時が本物の成果となるだろう」と考えた。

シェーファーは、2016年3月の対局では李が勝利するだろうと考えた。プロ棋士で国際囲碁連盟事務局長の李夏辰(英語版)は、AIが李に挑戦する見通しに「非常に興奮している」と意見を述べ、両者に等しく勝利する機会があると考えた。

囲碁の専門家は樊に対するAlphaGoの打ち方について、大局観に欠ける点などのミスを指摘したが、樊との対局から李との対局の間にどの程度プログラムが改善されるかは未知であった。Google DeepMindのデイヴィッド・シルバーは、AlphaGoは李の以前の棋譜を使って特別に鍛えられてはいないと述べた。
プログラムに用いられたアルゴリズムについて記述したNature誌に掲載される論文の発表と合わせるために、このニュースの発表は2016年1月27日まで遅れた。

画像第1局の盤面。白がAlphaGo。李世乭との対局

2017年初頭、ネットの囲碁対戦サイトに「Master」を名乗る打ち手が出現、日中韓のトップ棋士を相手に60戦無敗という驚異的な戦績を挙げて話題を集めた。
1月5日になり、開発者デミス・ハサビスはツイッターにて、MasterはAlphaGoの新バージョンであることを明かした。これらの対戦は非公式なテストであり、2017年内に本格的な公式戦を行う方針としている。

柯潔との対局 Demis Hassabishttps://twitter.com/demishassabis?s=20
出典: フリー百科事典『ウィキペディア(Wikipedia)』


https://twitter.com/demishassabis?s=20


ウイキペディア

この記事が気に入ったらサポートをしてみませんか?