見出し画像

驚くべき生成型AIはいったいどこまで進化するのか。現状を把握する 佐々木俊尚の未来地図レポート Vol.743

特集 驚くべき生成型AIはいったいどこまで進化するのか。現状を把握する〜〜〜いつかAIが人間の想像力を超えて傑作をものにする可能性


生成型AI(Generative AI)が爆発的な進化を遂げており、一般人のみならず専門家まで驚愕しています。先日、BSテレ東の番組「日経ニュースプラス9」でAIの第一人者として著名な東大の松尾豊先生とご一緒したのですが、ChatGPTの驚くべき能力について「いったい何なんでしょうね」とつぶやかれておりました。


今回のメルマガでは、生成型AIの可能性と限界、そして未来の可能性について現時点で判明している情報にもとづいて解きほぐしていきましょう。


昨年一世風靡したステイブル・ディフージョンのような画像生成AIにしろ、今年になって話題沸騰になってるChatGPTやBing AIにしろ、これまでと同じ深層学習のアプローチであることには変わりはありません。大量のデータを学習し、そこから人間には見分けられないような特徴や傾向を抽出し、それらを使って的確な将棋や囲碁の手を予想したり、過去の名曲に似た音楽をつくったり、群衆の中から指名手配犯に似た人物を探し出したりしているわけです。


このデータの量を増やしていけばAIの特徴発見能力はさらに高まっていくだろうというのは、容易に想像できたことです。しかしデータの量を増やしたからといって、突如として豹変するように進化するというのはAIの研究者も予測していなかったようです。


生成型AIの能力が高いのは、データの量が爆発的に大きいことです。たとえば画像生成のステイブル・ディフージョンは、毎月数十億のウェブページをクロールして収集したデータの中から、解像度がじゅうぶんに高く標準以上の質を持っていることなどで絞り込んだデータを学習しているようです。数十億枚ぐらいの画像データと、それに紐づいた画像説明(キャプション)などのテキストデータを持っているということなのでしょう。


対話型のChatGPTもインターネットをクロールし、45テラバイトものテキストデータを収集しているとされています。ここからノイズやフェイク、倫理的におかしいデータなどを別のAIを使ってフィルタリングし、570ギガバイトのサイズにまとめデータを利用しているとされています。


どちらのAIも、端的に言えばインターネット全体をデータとして学習していると言えるでしょう。それを高性能なAIで処理しているのです。深層学習というのは比較的に単純な計算式で処理されており、その変わりに変数(パラメータ)が大量にあるというのが特徴なのですが、ChatGPTの深層学習に含まれているパラメータ数はなんと1750億個。想像を絶する数です。


深層学習のパラメータは、情報を処理するときの「重み付け」のために使われています。重み付けとは、情報と情報がつながる強度のようなものです。多くのデータを学習していくうちに、この重み付けの数値が変化し、全体として的確な特徴・傾向を見つけられるようになる。そして実はこのしくみは、人間の脳の神経細胞によく似ています。神経細胞はシナプスというしくみで互いに接続されていますが、このシナプスが神経細胞同士をどうつなぐのかという重み付けをおこなっているのです。


実際には深層学習がこの神経細胞のしくみを真似したというほうが正しく、だから深層学習のようなAIは神経細胞から名前をとって「ニューラルネットワーク」と呼ばれているわけです。


人間の大脳のシナプスの数は、100兆もあるそうです。そしてChatGPTのシナプスにあたるパラメータの数は1750億。だいぶ少ないように感じますが、でももう600分の1です。先端AIのパラメータ数が100兆に達するのもそう遠い未来ではないかもしれません。その時に、AIには何が起きるか。


そもそも、人間の脳だって根本的には解明されていないのです。1000億個ぐらいある神経細胞が、100兆ものシナプスで相互につながっているだけという単純な構造から、なぜこれほどまでに複雑な思考ができて、「自分は自分である」という自己意識さえ生まれるのか。記憶の領域が海馬にあるとか一部は判明していますが、では自己意識はいったいどこにあるのかというと、その場所さえわかっていない。大脳全体に分散しているのではないかとか、いくつかの仮説は出てきていますが、決定打はまだありません。


それと同じように深層学習の単純な計算式も、膨大なパラメータを持つようになれば、中で何が起きているのかはわからなくても、信じられないぐらいに複雑なことができるようになってきている。この先にひょっとしたら、自己意識だって生まれるかもしれません。


深層学習の延長線上に、自己意識や人格を持つ人間のような知性は生まれることはない、というのがこれまでのAI研究の常識だったはずです。だから文化系の言論人とかが「スーパー知性が誕生して人が支配される!」とか騒いでるのを「そんなわけないだろうが」と研究者たちは生暖かく見ていたわけです。


しかし今回、データ量を激増させた生成型AIが従来では考えられないほどに進化してしまった。この驚愕は、AIの専門家たちに「さらに進化したら、今の深層学習のアプローチでも、ひょっとしてひょっとして……」とうっすらと思わせるぐらいにはなってきているようです。


この先に、AIはどの程度のクリエイティビティを発揮するようになるのでしょうか。


ChatGPTで小説を書かせるというのは、すでに多くの人が試みています。普通に面白そうな小説を書いてくれるぐらいにはなっています。これに画像生成AIでつくった画像を合わせれば、漫画もつくれます。暇つぶしに読むコンビニ漫画コンビニ小説とか、スマホの気楽な縦スクロール漫画とかぐらいなら今すぐにでも量産できるようになりそうです。


ここで議論になってくるのが、では「これまでにないまったく新しい世界観を持つような作品」をAIは生み出せるのかどうか。具体的に言えば、村上春樹さんが存在しなかった世界でAIは村上春樹文学を生み出せるのか、「進撃の巨人」をゼロから生み出すことができるのか、という議論です。


もう少し先の未来には、先ほども書いたようなAIが自己意識を持つような未来では、人間の文学者や漫画家と同じような天才的想像力を発揮し、22世紀の「進撃の巨人」を描くようになるのかもしれません。では現時点もしくはこの数年ぐらいのスパンではどうでしょうか。


ポイントは、AIが作った作品をどう評価するのかというところにあるとわたしは考えています。


たとえば囲碁や将棋のような「二人零和有限確定完全情報ゲーム」であれば、「勝ちか負けか」しかないので評価は簡単です。だから2016年に世界トップの棋士を破ったグーグルの囲碁AIは、過去の人間の棋譜を大量に学習しただけでなく、囲碁AIを二つ作って過去の人間の対戦数をはるかに超える膨大な対戦を行わせ、強くなることができました。


このような方法がコンテンツでも可能でしょうか。「おもしろかった」「涙が出た」という単純な評価なら学習させることは可能でしょう。だから暇つぶし漫画のような単純なコンテンツなら、「これはすげえ面白い」という質の高さを担保した作品群を大量に生み出すことはたぶん可能。


しかし「進撃の巨人」や「村上春樹文学」のようなまったく新しいコンテンツは、評価基準が明白ではありません。


ここから先は

12,746字

¥ 300

この記事が気に入ったらサポートをしてみませんか?