見出し画像

人間とAIの未来を考える#1:今起きていること(2023年2月)

kintarohです。

前回は、自己紹介とこれから書き残しておきたいことを整理してみました。
実質的な第一回となる今回は「人間とAI」をテーマに書いてみたいと思います。

急速に身近になったAI

『画像生成AI』と『ChatGPT』の登場

AIというと、ほんの一年ほど前までは「先進的な企業や技術者が取り組んでいること」といったイメージが一般的だったかと思います。
しかし、昨今の「画像生成AI(Stable Diffusionなど)」「ChatGPT」の登場(それぞれの内容はnoteでもたくさん取り上げられているのでここでは省きます)により、一般の方々(主に”AI分野に精通した技術者”と区別するために本文では敢えてこう呼びます)が、具体的なAIのアウトプットに触れる機会が増え、様々なメディアでも数多く取り上げられるようになってきました。

ちょっとしたキーワードを入れるだけで、数十秒から数分で完成されるデジタル画像や、まるで人間のように自然な文章で受け答えするチャットを見て「こんなことができるなんて凄い!」「ついに人間を超えた!」という意見や「思った通りの画像が出ない」「答えが正しくない」など、一般の方々の間でも実際に使ってみた感想や議論が飛び交うようになりました。

いずれのAIも、そのベースとなっている技術は、最近になって急に発展したわけではなく、数年前から着々と研究と実証が積み上げられてきたものです。画像生成AIもChatGPTの基となっている自然言語生成AIも数年前から既に研究内容が発表されていました。では、なぜ画像生成AIやChatGPTがこれだけ注目されるようになったのでしょうか。

自分で”使える”AI

一般の方々にとって、これまでのAIはどちらかといえば、機械などに既に組み込まれていた(例:お掃除ロボット、エアコン、自動運転)形で提供されていたものが大半であり、車のエンジンやパソコンのCPUにように、「何か性能の良いものが入っている」くらいのイメージだったのでは無いでしょうか。

ところが画像生成AIやChatGPTは、自分で直接使えるAI、より具体的にいうと「自分のインプットの工夫次第で様々なアウトプットを返してもらえるもの」になり、まるで一人一人がAIと直接やりとりしているようなものになっていることが、これだけのブームを起こしている大きな要因の一つだと考えています。

しかし、AIの発展にとって本当に凄いのは、技術そのものよりも、この状態を作りあげた人間の力だと私は考えています。

今起きている本当に凄いこと

ビッグテック企業とAI

これまで、AIのモデルを構築するには、膨大なデータだけでなくハイパワーのコンピューターが必要であるのが常識でした。つまり「膨大なデータ」と「ハイパワーのインフラ」を持つビッグテック企業(Alphabet、Amazon、Meta、Apple)の独壇場であり、他の企業との差はどんどん広がるばかりと思われていました。

風穴を開けた「Stability.AI社」

私は、イギリスに本社を置くStability.AI社が「Stable Diffusion」という画像生成AIモデルを一般向けに無償公開した2022年8月22日こそが、現在までつながる大きな潮流を生み出した記念すべき日だと考えています。
今からたった半年前の出来事です

実はその約1ヶ月前には「Midjourney」という画像生成AIを使ったツールが公開され、ゲーマーを中心に話題になっていました(ゲーマーがよく使うチャットツール上でサービスが展開されたため)。しかしStability.AI社はツールやサービスではなく、AIモデルそのものを無償公開し、しかもそれは自宅で使うようなPCのパワーでも動くものだったのです!

「Stable Diffusion」のようなAIモデルを作るには、数千万円という膨大な計算コストだけでなく、それに至る研究時間も含めた様々なコストがかかっています。しかし、それを特許で囲うこともせず、惜しげもなく全世界に公開し、しかも誰でも使えるようにしたのです。

Stability.AI社の日本語のWebサイトには以下の記載があります。


Stabilityでは、画像、テキスト、ビデオ、音楽、3Dを使ったジェネレーティブAIで、人々、コミュニティ、企業の創造的な可能性を引き出すことを第一の原動力としています。私たちは、真にオープンなAIこそが、途方もなく新しい創造性ツール、より良い連携、そして最先端のビジネスアプリケーションのブレークスルーを実現する最良の方法であると信じています。


この「真にオープンなAI」という思想と大胆な行動により、ビッグテック企業が独占していた領域を一気にひっくり返してしまいました。

その後何が起きているのか

画像生成AIの世界では、最初は「どんなテキスト(プロンプト)を入れるとどんな画像が生成されやすいか」といった知識と成果物が共有されました。しかし、世界中の技術者たちは並行して、より自分の「作りたい画像」が出力されるようにモデルそのものを目的別(例:写真に特化、ファンタジー風の絵に特化、アニメに特化)に改変(モデルをゼロから作ることに比べると、改変にはコストはそれほどかかりません)し、競って無償公開をしはじめました。

技術のオープン化とさらなる知の共有

Stability.AI社が火をつけた「真にオープンなAI」の流れは、モデル公開にとどまりません。「モデルをより使いやすくするための様々なツール類」「仕組みを理解するための解説資料」「さらなる性能向上のための手法」「動画をはじめとする様々な分野への応用事例」など、これらが今も世界中の技術者の間で競い合うように次々と公開され続けています。

一方、OpenAI社のChatGPTは、Stable Diffusionと違ってAIモデルそのものではありませんが、その利用に関しては同様に無償で全世界に公開されました(2022年11月)。実は公開前、同社内では「本当にこれが役に立つものなのか?」と懐疑的だったようです。しかし、こちらは利用へのハードルが画像生成AIよりも低く一般の方々でも利用できることもあり、公開たった6日でユーザーが100万人突破、そして公開後は画像生成AI以上に、様々な利用方法や応用例が世界中で次々と公開され続けています。

AI分野で起きた”人間による”「創発」

私も数年間ずっとAIの動向を追いかけていましたが、正直この半年前の変化とそのスピードは本当に信じられないほど脅威的です。
(ほぼ毎日と言っていいほど新しいニュースが飛び込んできます)

今まさにAI技術分野で起きている急速な発展は、これまでクローズドだった世界が、急にあらゆるものが共有され始めた結果、ある人のアイデアをヒントにしたり触発されたり、ある部分では競い合ったりして、人間によって一気に創発(部分の性質の単純な総和にとどまらない特性が、全体として現れること)したのだと思います。

私はAIの技術そのものより、人間による知の共有と競争、それによる創発こそが真のブレイクスルーな気がしてなりません。

つまり言いたいのは、凄いのはAIではなく人間だ、ということです。
(なんて単純な結論・・・)

おわりに

書き始めたら随分と長くなってしまいました。。。
今回の背景には、目先の利害にこだわらない技術者の矜持(先に金銭的なものを考えず、純粋に技術的な興味を追求する)みたいなものも関係しているのかもしれませんが、世界中の人間が協力し、競い合って物事が発展するなんて、まるで映画のようでロマンを感じてしまうのは私だけでしょうか。

駄文を最後まで読んでいただきありがとうございました。


この記事が気に入ったらサポートをしてみませんか?