「人工知能は人間を超えるか」を読んで自分なりの理解をまとめたうえでフィクションを想う

2022年1月7日 12:38

「人工知能は人間を超えるか　ディープラーニングの先にあるもの」（松尾豊著）を読了した。

　ここのところ、Java（研修で勉強した）を勉強し直したりITパスポートの勉強をしたりしていたのだが、去年の暮れごろ社長が雑談の流れで「人工知能なんかについても勉強しといてよ」と言い出した。

　ご存じかもしれないが、学生時代、私は理系科目が死ぬほど苦手だった。特に物理とか数学ABとか、単純な計算ではないやつ、なんか仕組みを理解したうえで計算しないといけないやつ。生物や化学に苦手意識がないあたり、多分幾何学が苦手だったのだろう。

　ゆえに、ぶっちゃけSEになろうって思ったのも一種の気の迷いだと思っているし、知識はマジでない。どれくらいないかというと「人工知能」って聞いた瞬間浮かんだのが「桜屋敷のカーラちゃんや」「RDや」「でも多分あの２つって違うイメージでとらえられていそうやなあ、人格の有無とか……」であるくらいだ。

　補足しておくと桜屋敷とはアニメ「SK∞（エスケーエイト）」に登場するAI書道家兼スケーターのピンク髪で私の好きなタイプのメンタルゴリラな男のことで、カーラはそいつが作った彼をサポートするAIのこと、RDとは児童書「怪盗クイーンはサーカスがお好き」をはじめとするシリーズに登場する世界最高の歌って踊れる人工知能のことだ。両方ともめちゃめちゃいい作品だし後者に至っては今年アニメ化するのでぜひ見てほしい。なおRDには内田雄馬の声が付く。

　話が逸れた。つまり、聞いた瞬間浮かんだのがそういう「創作物におけるポジティブな印象を付与されている人工知能」達であった。それから「あれ？　そういや創作物ではさんざっぱら読んでいる気がする人工知能のこと、私は何も知らないな……」と思ったわけである。ついでにプログラマとして雇われている身なので勉強と称して人工知能の本を読んで創作物に関連する知識をつけられるのお得だな？　とも思った。そこで手始めに、社内にアホほど置いてある本の中から松尾豊先生の「人工知能は人間を超えるか　ディープラーニングの先にあるもの」を手に取ったわけである。

　この本を選んだのに特に意味はない。「人工知能についても勉強しといて」と言われたから「人工知能」とついている本を選んだだけだ。松尾先生のことも特に何も知らなかった（軽く調べたら人工知能についての本をめちゃめちゃ出しているし研究の第一人者っぽかった）。わからなくて寝るかもな、と思いながら読み始めた。

「はじめに」を読み始めた段階でちょっとびっくりした。というのは、松尾先生（以下筆者と呼ぶ、私のことは私とか自分とか呼んでいるので）が学生だった1997年～2002年ごろの、人工知能研究に対する冷たさがわかるエピソードが開始2ページでぽんと出されたからである。

・・・（前略）先生方から言われた言葉に、私は衝撃を受けた。
「広告なんてくだらないものをやるな」
「言葉のネットワークが簡単にできますなどと言うな」
そして最後に浴びせられた言葉が極めつけにひどかった。
「あなたたち人工知能研究者は、いつもそうやって嘘をつくんだ」

「人工知能は人間を超えるか　ディープラーニングの先にあるもの」(p4)

　これは筆者が「大量のウェブページを分析することで言葉の関連性を取り出す技術を使えば一見関係なさそうな言葉でも関連性を認識でき、適切な広告が打てる」という技術の研究を研究費の審査の場でプレゼンしたときに返ってきた言葉だという。筆者も説明している通り、これは今となっては当たり前の技術というか、多分これを読んでいるみんなも知っている通り、雑にグーグルとかで検索かけると会社の広告がヒットしたりするあの技術のことなんだけども、それが筆者の学生時代にはボロクソ言われていたらしい。嘘やん研究費の審査の場で複数の先生にそんなん言われたら泣いちゃうわ。それかレーザーポインターで目を照射してしまうわ。なあ。

　でもそういう時代がつい二十年前にあったんだ、というのがまず大きなインパクトとして出てきた。

　でも、今の時代って人工知能って結構ポジティブなイメージなことない？　将棋かなんかでも勝ったりしてるし、あとなに、それこそ人工無能ちゃんとかAI女子高生りんなちゃんとかエアフレンドとかって出てきてるし。あれが本当に人工知能の技術を使っているかどうかはともかく、キーワードとして並べられたときに面白がられる程度にはいい印象があるわけで。なしてそんなボロクソだった時代があったわけ？　そういや人工知能研究って意外と歴史は古いんだよな、インターネット黎明期から断続的にやってませんでしたっけ？　あれ？

　このエピソードでぐっと引き込まれて読み進めたところ、人工知能ブームというのは今までに2度あったらしい。1度目は1956年～60年代、2度目が1980年代。この辺聞いた時「なるほどはやみね先生が人工知能とかあの辺の知識やけにあってRDみたいな存在を登場させているのはそういうことか……」という顔をした（先生の年齢から逆算すると20歳の時にちょうどブーム真っただ中なので）。その2度のブームのどちらもが「人工知能はもうすぐできる！」とあちこちで煽られた挙句できなかったので冷たい目で見られた、という終わり方だったらしい。そら冷たい空気にもなる。煽った誰かさんが悪かろうが。

　筆者は3度目になろう今回のブームに対してやっぱり警戒しているようで、その結果としてこの著作が生まれたらしい。

　個人的には筆者のたとえ話のひとつとして「宝くじ」の例がうまいな、と思う。人工知能研究において新しく生まれた技術「ディープラーニング」は宝くじだ。うまくいけば5億円かもしれない。一方で冷静に現状の技術を見ると、ある一定の分野においては人間を上回ることもあるが、そう簡単には夢物語のような「人工知能」が出来上がるとは考えにくい。宝くじの当たる金額の期待値が300円であるように。つまり、上限値（人間を上回るめちゃすご人工知能が生まれる！）と期待値（人工知能の得意分野では人間を上回るかもしれないが人間と同等かそれ以上の知能を持つ存在がすぐに生まれるとは考えられない）を一緒くたにしてはいけない、という話。

　ざっくり言うならばRDみたいな「何でも分かってくれるし何でもできる人間よりすっげー存在」みたいなのはまだまだ生まれないけど、技術的ブレークポイントとなる技術ができたので、それを正しく理解してくれよな！　ってのがこの本である。

　そもそも「人工知能」と言ったときに、我々素人と研究者の想定するものはまったく違うらしい。素人目線だとカーラやRDや、HAL9000や、某将棋ロボやなんかが思い浮かぶんじゃないかと思う。フィクションベースで言うと人工知能は「知能を持ったコンピュータ。自分で考えて調べてそれをもとに自己判断を下せるもの。その結果を人間にフィードバックしてくれたり、時には人間を害したりするような存在」だ。リアルベースで行くとどうだろうか。「たくさんの情報をもとに最適解を取り出してそれを出力できるもの。そこに感情的なものはなく、常に理性のみで判断した結果が出力される存在」とかだろうか。

　でも、研究者目線で言うと結構違う。というか、研究者の間でも意見が割れている。p45に筆者を含んだ13名の著名な研究者の定義が表になっているが、「情緒」を持つか持たないか、「人間」と区別がついてもいいかついてはいけないか、技術のことなのか世界観なのか、もうめちゃめちゃに割れている。人工知能学会は結構フランクらしいが、まあそうじゃないとこんな意見バラバラな人達が意見交わし合って高め合えないよな～と思った。お前の思う人工知能がお前の求める人工知能なんやで、知らんけど。

　そもそも、「人工知能の歴史は、人間の知的な活動を一生懸命まねしようとしてきた歴史」であるらしい（p38）。原理不明の人間の「知能」を解き明かそうとした場合の構成論的アプローチの結果が「人工知能研究」になるわけで。人間はなぜ世界をこのように認知し、行動できるのか？　我々はなぜ思考できるのか、新しいことを考えられるのか？　そういうことを解き明かしたくて始まったのが、人工知能の研究なのだという。

　人間は推論を行う。舗装された道にネギが落ちていたら「ああ、ちょっと先にスーパーがあるから買い物帰りの人が自転車から落として気づかないまま行っちゃったのかな」とか考えられる。これはなぜできるのかというと「ネギ」は「近くのスーパーで売られて」おり、「大きい」ので落としてわからないわけはないけれども「自転車に乗っている人は後ろを向けない」ので「落とす可能性がある」などの知識があるからだ。

　ではなぜ人間は「知識」を得られるか。赤ん坊は周囲にあるものを見る。それを情報として吸収する。はじめのころは「見る」だけだが、自分の手足や口を使って触れるようになる。触覚情報もものを判別するのには大切だ。次第に赤ん坊は情報をもとに万物を分け始める。「快」なもの、「不快」なもの、食べられるもの、食べられないもの、熱いもの、冷たいものなど。それらにラベリングするには大人の与える情報が必要になってくる。たとえば、耳の聞こえる子なら「自分の周りによくいるもの」が「パパ」とか「ママ」とかいう符号を使っているのを聞き取り、これを試しに出力してみる（パ行、マ行は赤ん坊にとって発声しやすいらしい）。すると自分に「快」の刺激を与えてくれるものが喜んだりするので、それを繰り返したり、別の使い方をしてみたりする。そうやって次第に言語を獲得し、こういう見た目をしているのが（あるいはこういうにおいがするのが、またはこういう触れ方をしてくるのが）ママ、こういうのがパパ、などと「具体物」と「符号」を連携させ始める。これが知識の始まりだ。

　p116で筆者曰く、「機械学習」も始まりは「分ける」ことにあるという。学習とはそもそも「分ける」ことで、それは前述の赤ん坊の例のように行われる。もう少し成長した時間軸の具体例としては、小学校の算数における「長方形」の概念を得るときなんかがいいかもしれない。たいていの教科書にはいろいろな四角形が提示してあり、それを仲間分けするところから授業が始まる。子供たちは「これは普通の四角」「これは斜めで変な四角」とか言いながら仲間分けしていく。そうして一通り「四角形（前年または直前の授業で既知の知識）にもいろいろある」ということをやってから、今まで「普通の」とか呼んでいた四角形に「長方形」という名前が付くことを知る（たしか正方形も一緒の単元だった気がする、ちょっと手元に算数科指導法の本がないので雑だが）。この時もしも子供たちが四角形を「普通の」と「変なの」に分けられなければ、教師が「長方形」という名前を教えても彼らが他の場面で長方形を見た時に「長方形」であると理解することはできない。名前をつけても見分けがつかないからだ。違いがわからないのに符号だけ出されてもどうにもならない。

　話は逸れたが、機械学習という、第2次人工知能ブームの後半から着々と伸びてきた研究では、このような「分ける」「学習する」という行為を人工知能のプログラムが行うのだという。方法としては大まかに2つある。教師あり学習と教師なし学習で、前者は単純に人間が「こう分けてね！」というルールを教えてその通りに分けるように指示したものだ。後者はデータを渡して、その中からルールを見つけ出して分類してね！というやり方である。こういった機械学習は時間がかかる（何しろ大量のデータを与えてそれを全部分析させるので）が、それを使って何かを予測するのは一瞬なので、学習が済んでしまえば大変便利だ。英語や古文の文法問題とか、日本史や世界史なんかも、覚えるのは時間がかかるけど答えるときは覚えていれば一瞬で済む、ああいう感じだと思う。

　ところで、従来の機械学習には難関があった。それは「分け方」だけは人間が指示しなければいけないという点だ。

　例えば創作物のRDはいとも簡単に「全米フォルダ」を作って「全米が泣いた！」的な展開とか話題とかニュアンスとかを判定して「全米フォルダ」を泣かせているが（どうやって泣いているんだとかはこの際置いておく）、あの場合RDは映画を見るか評論を読むかブログを閲覧するかして「全米はどのような状態に対して泣くのか？」を判別し、データベース化、それをもとに「私の全米フォルダが～」とか言っているわけだ。

　では、何をもとにRDは「全米が泣いた！」の要素を抽出しているのか？

　これが機械学習での難関である。大量のデータをどういう理由で分類するのか？　筆者曰くの「特徴量設計（何がそれをそれたらしめる根幹なのか）」をプログラム自身が見つけ出す、ということは、「世界からどの特徴に注目して情報を取り出すべきか」（p139）を人間の手を借りずに行うという意味だ。これができないために、人工知能は実現できないでいたのだという。逆に言えば「何に注目して情報を取り出せばいいのか」「その特徴はどの程度までが特徴と言えるのか」がわかれば（「特徴」の閾値をプログラムが自力で獲得できれば）この問題はクリアできるらしい。

　話は脱線するがRDえげつねえよな。ここまでの話って2012年までは解決できていない話なんだ。RD初出何年だった？　2002年？　創作物だし何があったっておかしくないでしょは確かなんだが、それにしても絶対はやみね先生はこの辺頭に入れて書いてただろ。そうじゃなきゃ「全米フォルダ」の概念は出ないやんけ。「全米フォルダが泣くの面白ーい」ってキャッキャしていた子供が大きくなってから「冷静に考えてRDの生みの親（ご存じない方のためにお伝えしておくとRDは作り手の倉木博士ってのがいてその人のことを「親」という符号をつけて認識している）が入れるわけのない情報だし「全米フォルダ」はRDの自作のはずだよな？」って気づいてぞっとしてしまった。先生2002年時点で「現状の人工知能ではできていないがこういうことを自力でできる人工知能が出てきたらRDみたいなのもできるやろな～」つって書いてたわけ？　やばいやん……

　閑話休題。

　2012年までは、って言うたやんけ。2012年に激ヤバターニングポイントが生じたんだって。それが画像認識人工知能のコンペに初参加でぶっちぎりの優勝をかましたカナダのトロント大学が作ったSuper Visionていう人工知能。毎年コンマいくらのパーセンテージのエラー率を26％台で競っていたところを、15％、16％でぶっちぎったらしい。なに？　10％違うが？

　前述したけども、この時点での人工知能研究って「結局『特徴量設計』を人間がどれだけよくできるか、ってところが人工知能の性能なのよね……」って状態だったんだよ。だから26％台は（東大のISIってのが3位でSuper Visionの次点だった、26％台）もうなんか人間がどれだけいい特徴量を作れるか？　っていう競い合いになっていたわけ。

　それがいきなり10ポイント引き離して優勝したカナダのトロント大学チームの登場によってもう大波乱なわけですよ。ほかの研究者も悔しいとかじゃなくもう何？　何が起きた？　なんでそんなことになった？！　てなものですよ。

　ここで登場したのが「ディープラーニング」というやつなんですって。ジェフリー・ヒントン先生が中心となってやり始めたらしい。研究自体はもうちょっと前からあったらしいんだけど、切り口が違ってたもんだからそらまあびっくりする。

　ニューラルネットワークという方法がある。機械学習における分け方の一つだ。人間の脳神経を真似しようとしてできたのがこれである。
　人間の脳はニューロンのネットワークでできている。あるニューロンは別のニューロンと繋がったシナプスから電気刺激を受け取り、電気が一定以上溜まると発火して次のニューロンに電気刺激を伝える。これを数学的に、あるニューロンは別のニューロンから0か1の値を受け取り、その値に何らかの重みをかけて足し合わせたうち一定の閾値（反応に必要な量）を超えると発火して（1になって）次のニューロンに受け渡される（発火しなければ0）。以下に一応図を用意したので参考にしてくれ。ならなかったらすまん。

　人間の脳にニューロンがあほほどあって、勉強する中でそれを強化していくように、プログラムにも大量のデータを与えて、それを判定する（それに重み付けする）値である「特徴量」をご用意して、その値を通過した時点で「こいつは何である」と判定してもらうわけ。それを何層も繰り返しやる（判定したものをさらに別の特徴量で判定して……）ことで正確な「特徴量」を見つけて正確な判定ができるようにする、っていう寸法。入力と全然違う内容が出力されたらそれは特徴量が間違っているのでそこをいじって……という気の遠くなるような作業をやるらしい。

　ディープラーニングはニューラルネットワークの進化系らしい。ニューラルネットワークだと入力したデータに対して別の出力データが出てくるところを、こっちでは入出力データを一緒にするのだと。計算ドリルの答えを写してから答えを見ながら答え合わせをする、みたいな感じ。多分。

　計算ドリルでこれをやると意味がないって怒られるんだけど、ディープラーニングでは違う。ここでは入力→重みづけ①→隠れ層①（重みづけ①で判定した結果）→重みづけ②→隠れ層②……を普通のニューラルネットワークよりたくさんやることで、隠れ層には「おそらく入力した値を特徴づけるであろう値」が生まれる。計算ドリルを写しているうちに「×９ってついてる式の答えって、いつも足したら９になるなー」ってことに気づくように。その特徴が必ずしもあっているとは限らない。そこで出力地点で元の画像を出してきて答え合わせをする。それを何度も繰り返していると、次第に「効率的に入力と同じ出力にするためにはこことここをまとめて扱えばいい」「こっちは考えないでいい」というようなことを学習していく。答え合わせをして結果が良かった時に隠れ層にできている値が優秀な「特徴量」である、という話だ。

　ディープラーニングではプログラムが自己符号化器ってやつで大量のデータを読み込んで「先に」特徴量を出し、その特徴量に対し「その特徴量を持つものは〇〇である」と「後から」人間が情報を教える。グーグルの猫という話が有名らしい。なんかぼんやり聞き覚えがあったので多分昔の小学生新聞とかで読んだのかもしれん。とにかく、重要なのは「今まで情報の特徴を人間がセットしてそれをもとにAIが判断していたのを、AIが先に情報の特徴を選び取って、それに人間が符号をつけてやるようになった」って話。

　これは今まで「何に注目して情報を取り出せばいいのか」「その特徴はどの程度までが特徴と言えるのか」をプログラム自身では判定できなかったって言ってたやつを覆す新しい技術だってわけだ。すげえ。知らん間に知らんことが起きていた。

　ディープラーニングではその特徴量を強化するために、あえて「ノイズの多い画像」を使うらしい。通常のデータの中にイレギュラーな情報を入れたデータを紛れ込ませておく。一緒に読み込ませる。イレギュラーな情報を含んでいても出てくる特徴量が「それ」を「それ」たらしめる特徴量である、ということらしい。あとあえてデータを一部欠落させる。そうするとほかのデータで補えるように特徴量が変化していく。あえて完璧ではないデータを与えることで、学習結果を強化していくらしい。アホほどコンピュータをいじめているが、それくらいやらないと正しい特徴量を確立していくのは難しいらしい。大変だな……

　この本はこのあたりで約3分の2になっている。ここから先はこれからの人工知能の話になっていた。そこも面白かったんだけどさすがに全部書いたら怒られそうだからこの辺で。

　改めてこうやって感想がてらまとめ直していて感じたのは、素人目線で「人工知能」って言っているときの焦点のあっていなさだ。冒頭でSK∞のカーラ、怪盗クイーンシリーズのRDを出したが、これは制作年代と作り手の「人工知能」理解の違いが如実に出ている。RDはそれこそ人工知能学会の人々が「最終的に到達する場所」の人工知能だし、カーラはどこまでいっても機械であって「情報の収集と分析、人間の出題に対して適切な検索・計算結果を出力する存在」だ。結構リアル寄りだよな。数年か十数年か経ったらできてそうなくらいの。これは作り手の想定する「人工知能」像の違いが生み出した違いだろう。

　カーラを作った脚本家さんは現代の、Siriとかオッケーグーグルとか（あるいはさかのぼって1964年のイライザのような対話システムだろうか？　脚本家さんの年齢知らないんだよな）を思い浮かべつつ、あれを進化させた存在としてAI「カーラ」を生み出したから、彼女は感情表現をすることもないし知識や計算が中核となったキャラクターなのだろうし、はやみね先生は人工知能の研究は始まった当初の基本テーゼ「人工的に作られた知能（人間のような知能を持つ存在）」としてRDを設定している。もちろん作風の違いとか、読者・視聴者層の違いもあろうが。

　でも、やっぱりそこにロマンを感じるというところが、今まで脈々と続いているのがいいな、と個人的には思う。私は児童書で生まれ育って人工知能といえばRDかAKB24（都会のトム＆ソーヤに出てくる別の人工知能だ）がぱっと浮かぶけれど、現在仕上がっているAIやそれに似たフィクションの存在にもワクワクする。人格だとか認知だとか、思考だとか、そういうものを人間とは違うやり方でやる存在が今後出てくるかもしれない、と思うと、遠足前日みたいな気分になる。楽しみなような、それでいて転んだりするんじゃないかと警戒するような。

　今後も自分の知らないところで、あるいは自分の知りうるところで、進化し続けるであろう技術が楽しみだ。

この記事が参加している募集

#読書感想文

207,615件

この記事が気に入ったらサポートをしてみませんか？