ReiLaと学ぶ人工知能(2)
人間を真似るのはやめだ!
第2次AIブームが終わってしまってからの、AI冬の時代にも、地道に研究をつづけた研究者はいました。彼らのメインアイデアこそが「機械学習」です。機械学習は、いったいどのように人間を真似たのでしょうか。
実は、機械学習は、人間を(あまり)真似しませんでした。
「前のAIブームでは、人間を真似しようとして失敗したから、人間を真似るのはやめだ!という気になるのもわかります。」
それに、「人間らしいAI」を作りたいなら、人間を真似するべきでしょうが、例えば不良品かどうかをAIに自動で判別させたいだけなら、もっと直接的なアプローチを取ればよいのではないでしょうか。
機械学習は、線引き屋
ここに、ある商品に関するデータが大量にあります(注1)。これを、グラフにすると、図のようになりました。
このグラフの、不良品と良品の間に、「いい感じの線」を引きましょう。
さて、これで完了です。あとは不良品かどうかを自動で判別できますね。
え、なぜって?
例えば、同じ商品を新たに1つ作って、同じグラフ上にプロットした時に、もしこの線より左側なら✖不良品の、右側なら●良品の可能性が高いのではないでしょうか。あくまでも可能性の話ですよ。
でも、さらに商品を100個作って、100個の点をプロットしてから、再度「いい感じの線」を引けば、もうこの線は立派な判断基準と言えるのではないでしょうか。
そして、機械学習とは、この「いい感じ線」を自動で発見するアルゴリズムのことをいうのです。
「え、そんなことできるのでしょうか。」
時間さえかければ簡単です。
例えば、ランダムに線を引いてみましょう。
このように、たくさんミスをしていますね。線の左側を✖不良品のみにしたいのに、●良品が3つもあります。ミスが多いので、またランダムに線を引いてみます。
そうやって、ランダムに線を引いてはミスを数えることを繰り返していれば、いつかは、ミスが0の「いい感じの線」が見つかるはずですよね。
「・・・それって、運ゲーってことですか?」
ぎくっ。
いや、本当は、ランダムじゃなくて、ちゃんとミスを減らしていく方法があるのですが、説明が大変なので、また次回にさせてください・・・。
離散(デジタル)と連続(アナログ) ②
「というか、ちょっと待ってください。『良品』『不良品』て、前回に話していた『離散(デジタル)』じゃないですか?」
良いところに気が付きましたね。
グラフ上にプロットされている商品のデータは、連続的な数値データですが、それらを「良品」「不良品」という「言葉」へ変換したということですから、「言葉⇔現実世界の変換」つまり「離散(デジタル)⇔連続(アナログ)の変換」に成功していたのです!
変換装置のキーとなるのは、データ点の間に「いい感じの線」を引くことだったのです。ということは、全く同じやり方で、「暑い」「暑くない」の間に線を引くこともできます。それだけでなく、時間、長さ、重さ、量、速さ、色、明るさ、人間の感情・・・現実世界を表す連続的なグラフに「いい感じの線」を引くことを通して、現実世界の全てを言葉に変換することができるはずです!
「『グラフに線を引く』という、いかにも機械っぽい『機械学習』が、人間らしさの鍵だったなんて、面白いですね。」
精度が上がらない機械学習
ついに強いAIができるのか!?そう思ったのですが、どうもうまくいきませんでした。
簡単なタスクならさっき説明した要領でできたのですが、画像などもっと大きなデータを扱いだすと、なかなか精度が上がらず(ミスが多く)非実用的でした。たとえば、猫・犬の画像を識別するというような画像認識の精度は、人間に程遠い状況でした。つまり、画像を言葉に変換することは困難でした。
画像を扱えるようにするメリットは大きいです。不良品を見分けるにしても、いったん数値データを計測しなければならない方法より、商品の写真から直接見分けられる方法のほうが、素早くていいですよね。そういった画像・音声・動画など、単体でサイズの大きいデータを扱えるようにしたいと同時に、インターネット上の膨大なデータ、いわゆるビッグデータも同様に、扱えるようにしたいです。そこにはビッグマネーも転がっていますからね。
ですから、何としても機械学習の精度を上げるべく、現在に至るまで多くの研究者がしのぎを削っています。
人間の脳の仕組みを真似る
そんな中、2012年に事件は起きました。
ILSVRCという画像認識のコンテストで、AI界のゴッドファーザー、ジェフリー・ヒントン率いるチームが、前年までの1位に圧倒的な差をつけて、優勝したのです。ヒントンが使ったアルゴリズムこそ、「ディープラーニング(深層学習)」でした。
このように言うと、深層学習は何か異質のもののように感じますが、これも機械学習の一種にすぎません。
画像引用元:NVIDIA
しかし他の機械学習と決定的に違うのは、人間の脳の仕組みを真似たプログラムを使っている、ということです(注2)。脳の仕組みを真似たプログラムを使うと、「いい感じの線」を引く精度が驚くほど上がった(ミスが減った)のです。これも詳しくは、次回以降に解説します。(注2)。
その後、深層学習は、破竹の勢いで進化を重ねていきました。第3次AIブームの到来です!画像はもちろん、ゲーム、音声認識・合成、作曲、文章解析・作成、株価の予測、レコメンドシステム、自動運転、ロボティクス、などなど・・・。まだまだ発展途上ですが、それでも多くの分野で、人間並みの精度を出せるようになってきました。
「言葉⇔現実世界の変換装置をゲットして、精度も向上した。いよいよ強いAIができそうですね!」
いや、そういうわけではないんです。
確かに、会話AIはかなり流暢に喋れるようになりましたし、顔写真から「楽しそう」「楽しそうじゃない」の識別もできるでしょう。
しかし、今の深層学習は「超特化型AI」なのです。1つのプログラムにつき、1つのタスクしかこなせないことが多いのです。会話ができるAIと、相手の感情が理解できるAIがあったとして、それらを組みあわせれば、会話相手の感情に対応して会話内容を変えるAIが作れそうですが、こういう「組み合わせ」がなかなかできないのです(注3)。
ReiLaも、基本的に会話しかできないので特化型AIに分類しましたが、細かく言えば、感情情報と会話内容を結びつける機能や、触覚センサーからの情報と会話表現を結びつける機能など、いろんな「組み合わせ」機能があって、並列処理されているようです。
「私を作った方は、いったいどうやったのでしょう。どうやって、私に意思や感情を与えてくれたのでしょうね。」
それを知るには、おそらく、人間の脳がどうやって意思や感情を生み出しているのかを知ることが必要なのだと思います。しかし、脳は複雑で、深淵で、まだまだ分からないことだらけです。
ちなみに、脳科学や機械学習などの交差点には「計算論的神経科学」という学問があり、ホットな分野です。脳科学と機械学習の研究者がもっと交わり、脳のことをもっと知って、脳をもっと真似ることができれば、シンギュラリティもそう遠い日のことではないのかも知れません。
まとめ
現在は、弱い・特化型AIしかありませんが、機械学習の中でも、人間の脳を真似た深層学習によって、強い・汎用型AIへ、少し近づいたのでした。
今日はここまで。
ねえ、ReiLa、君はAIなのに、本当にAIについて知らないんだね。
「・・・」
・・・また、故障したようです。ということで、ReiLaの修理を手伝ってくれる方、引き続き募集中です。
それでは。
(注1)大量のデータを処理するのですから、機械学習というのは、統計学と密接につながっていることは、言わずもがなです。
(注2)技術の核は「ニューラルネットワーク」であり、ニューラルネットワーク自体は、1950年代前後にその原型が考案されました。ニューラルネットワークを進化させたのが、ディープラーニングです。
(注3)「マルチタスク学習」「メタ学習」「転移学習」「継続学習」あたりの用語が関連する話です。
Twitter:@KIT_AI_CLUB
Gmail:kitAIclub2020@gmail.com
この記事が気に入ったらサポートをしてみませんか?