見出し画像

生成AIは人類の脅威か? 救世主か?

著者:今井翔太/提供:SBクリエイティブ

 2022年11月に公開された言語生成AIであるChatGPTは、史上最速(5日!)で100万人のユーザーを獲得したサービスとなり、生成AIブームの火付け役となりました。

 それから2024年5月現在までのたった1年半で、画像や音声などさまざまな分野の生成AIも爆発的に普及し、プロが生み出すのと遜色ない品質の生成物が大量に生み出されています。生成AIが生み出すであろう莫大な恩恵を享受しようとする流れと、脅威を抑えようとする流れが交錯し、混沌とした渦をなしています。

 そもそも生成AIとはなんなのか、何ができるのか。まずは、生成AIの定義を示しておきましょう。

 私が説明してもいいのですが、せっかくの機会なので、生成AIに自分自身の説明を聞いてみました。

 生成AIは、人間が行うような新たなアイディアやコンテンツをつくり出す能力を持つ人工知能の一種です。これは一般的に機械学習、特に深層学習の手法を用いて実現されます。その応用範囲は広く、文章の作成から音楽、絵画、デザイン、ゲームのレベル設計、さらには科学的な仮説の生成まで、人間の創造性が求められるほとんどすべての分野に及びます。

 生成AIの1つの重要な特徴は、大量のデータからパターンを学習し、それをもとに新たな出力をつくり出すことができる点です。たとえば、文章生成AIは、何百万もの文書から文法や語彙、文章の構造などを学習し、それに基づいて新たな文章を生成します。同様に、画像生成AIは、大量の画像から色彩や形状、テクスチャなどのパターンを学習し、それをもとに新たな画像を生成します。

 しかし、生成AIが「創造的」であるということは、それがまったく新しいアイディアやコンテンツを無から生み出すという意味ではありません。むしろ、既存のデータからパターンを学習し、それらを組み合わせて新たな出力を生み出すというプロセスを指します。この点は、人間の創造性と多くの類似点を持っているとも言えます。なぜなら、人間も、これまでに経験や学習した情報をもとにして新たなアイディアを生み出すのですから。

 また、生成AIの潜在的な力を引き出すためには、それが働くフレームワークやルールを設定することが重要であり、これを適切に行うことで、AIの創造性を制御したり、指導したりすることが可能になります。

ChatGPTによる回答を引用

 AIを研究している身から見ても、ほぼ100点満点の回答です。2022年以前であれば、研究者でも一般の方でも、驚きひっくり返っていたような完璧な文章です。全体的な説明はこれで十分ですが、議論を進めるためには少し足りない部分があるので、私のほうから補足します。

 ChatGPTが説明してくれた通り、生成AIは新たに文章や画像、音声などをつくり出すことができる人工知能技術の一種です。ディープラーニング(深層学習)は、機械学習という人工知能の要素技術のなかでも、特に人間の脳を模倣した深いニューラルネットワークを学習する手法を指し、現在の生成AIはこのディープラーニングによって実現されています。

 ディープラーニングや機械学習のアプローチは、一般的に識別的なものと生成的なものに分けられます。専門用語ではこれらを識別モデル、生成モデルと呼びます。

 識別モデルは、画像のようなデータを文字通り「識別」するAIを指し、顔認証やニュース記事の分類など、これまでにも馴染み深いAIはこちらに属します。

 一方で生成モデルは、データが生み出される背後にある構造や表現を学習し、自身が学習したデータと似たデータを生成できるAIを指します。生成AIは一般的に、生成モデルのアプローチに属するものです。

 ただし、実は「生成AI」という言葉は、研究者の間で元から使われていた用語ではありません。文章生成AIや画像生成AIなどの技術が同時進行的に普及した結果、それらをまとめて呼称するために特にメディアが使い始めた用語であり、先ほど説明した生成モデルとは厳密に対応しない部分もあります。

 また、ここで言及する生成AIはもう少し広い概念として考えます。具体的には、生成AIの本体であるニューラルネットワークに加え、そのニューラルネットワーク出力を起点にいくつかのツールや機能を組み合わせて構成される生成システムも含めて「生成AI」と呼称します。

 最も有名な生成AIであるChatGPTも、言語を生成する本体は言語モデルと呼ばれるニューラルネットワークですが、対話形式のインターフェースや拡張機能などは、システム的に実装されたものです。

「この世にない新しいもの」を生み出せる

 生成AIは、元々は人間が生み出した文章や画像、音声などの膨大なデータから学習します。しかし、生成AIの出力は、学習元となったデータをただ真似るのではなく、背後にある本質的な構造や表現をとらえ、新しいものを生み出すことができます。

 生成AIに何かを生成させるとき、生成したいものを指定する入力文を「プロンプト」と言います。そのプロンプトで指定する内容が、実世界には存在しえないもの、人間が今まで生み出したことがない新しいものであっても、生成AIはその指定された対象を生成することができます。

 次の図1‐1は、生成AIに対し、「バットで地球に飛来した隕石を打ち返そうとする猫」とプロンプトを入力し、生成させたイラストです。このプロンプトでは、実世界には存在しないであろう荒唐無稽な概念を指定していますが、画像の生成AIは学習した概念を組み合わせた画像を生成しています。

図1-1 生成AIによる「バットで地球に飛来した隕石を打ち返そうとする猫」の画像(出典:「Midjourney」にて筆者作成)

 生成AIへの入力は、プロンプトのような文章であるとは限りません。画像を入力として、新しい画像を生成することも可能です。図1‐2は、先ほど生成した「バットで地球に飛来した隕石を打ち返そうとする猫」を「犬」に変えた画像です。

図1-2  生成AIによって図1-1の「猫」を「犬」に変えた画像(出典:「Midjourney」にて筆者作成)

 次の図1‐3は、「こんな感じのサイトをつくりたい」と紙切れに書いたものをスマートフォンで撮影し、その写真をGPT-4Vに入力した場合の出力です。手書きのラフは粗雑なものですが、それをもとに出力されたHTMLやJavaScript(Webページを作成するためのプログラミング言語)のコードをそのまま貼り付けて開いてみると、見た目のみならず機能面も含めて再現されています。これなら誰でもお絵描き感覚でアプリケーションをつくれそうです。

図1-3 手書きラフから生成AIを用いてWebページを作成(出典:「GPT-4V」にて筆者作成)

 生成AIが出力できるのは、単なる文章や画像、プログラミングコードに限りません。生成AIを拡張した機能を使えば、大学の講義で使用するような教材をゼロから生成することもできますし、線画イラストへの着色(図1‐4)、画像をもとにした部分的な加工(インペイント)や付け足し(アウトペイント/図1‐5)も自動で行えます。

図1-4 線画をもとに高品質な着色が可能(出典:「Stable Diffusion」にて筆者作成)
図1-5 画像の一部から拡張する加工(アウトペイント)が可能(出典:「Midjourney」にて筆者作成)

 ここでご紹介した以外にも、自分の声を好きな声質や言語にできる音声生成AI、動画・アニメーション、3Dモデル、さらには分子構造といったものを出力できる生成AIなど、さまざまな生成AIがすでに存在します。

史上最速で社会変化をもたらす「生成AI革命」

 2024年1月に『生成AIで世界はこう変わる』という新書を上梓しましたが、2022年後半に生成AI革命が起こってから、本書の執筆段階までに起きたことのみを挙げても、すでに数十年分の技術革命があったかのような様相です。

 ChatGPTの発表直後、Google社は社内にコードレッド(厳戒警報)を発令したとされています。ChatGPTの出現が、Google社の検索事業に深刻な影響を与えると判断されたためです。実際、Google社に対抗するMicrosoft社は、すぐに検索エンジン「Bing」にChatGPTを搭載し、Google検索エンジンを追いかけています。1つの技術によって、突如、世界一の企業の地位が脅かされる事態になっているのです。

 そのMicrosoft社は、私たちが普段利用するパワーポイントやワード、エクセルなど、ほとんどのビジネス製品に生成AIを搭載すると発表しました。私たちの生産作業が根本から変わろうとしています。

 画像生成AIで生み出したアートは、アメリカの芸術コンテストでグランプリを獲得し、ドイツの世界的な権威ある写真コンテストで入賞するレベルに達しています。突如として、すべての人間に、今までのプロクリエイター並みの作品を生み出す力が解放されたと言っていいでしょう。

 教育も生成AIで大きく変わろうとしています。東京大学をはじめとする国内の各大学は、生成AIの利用に関する声明を発表しています。問題への解答やレポートの作成に生成AIが使われる事態は容易に想像でき、従来の教育方法は成立しなくなるでしょう。生成AIに聞けば大体の疑問は解決し、対話的な議論も可能なことから、現在のように教員が生徒に知識を与える教育形式にも変化が起きるかもしれません。

 すでに生成AIは、世界中のリーダーの主要な関心事となっています。2023年5月に開催された広島サミットでは、生成AIが議題に上り、首脳宣言のなかで生成AIの議論を進めるための「広島AIプロセス」を立ち上げることが発表されました。同年7月には、東京大学で日本国内の政治、学術、経済界のリーダーが集まったシンポジウムが岸田文雄内閣総理大臣出席のもと開催され、今後の国内の生成AIの取り組みについて議論されました。

 一方で、生成AIがもたらす脅威も無視できません。

 IBM社は一部職種の業務が生成AIによって代替できるとし、採用を凍結。雇用削減を行うことも示唆しています。その他の企業でも、カスタマーサポートなど、生成AIによって代替可能な職種すべてを解雇するといった動きが出始めています。

 中国では、画像生成AIの活用により、イラストレーターへの報酬が10分の1になったという事態が報告されています。ハリウッドでは、脚本をAIにつくらせる動きに反発し、映画脚本家らがストライキを起こしています。

 政治の世界でも、アメリカの大統領選挙に関連し、対立陣営の存在しない写真を生成して煽動するような行為が報告されています。生成AIを使って声を変換した電話による、詐欺や政府高官へのなりすましといった事件も発生しています。

AIは人間の知能を超えるのか

 AIを研究している身であっても、生成AI革命の先に何が起こるのか、正確に予想することはできません。それでも、やはりAIについて一番考えているのはAI研究者です。

 『生成AIで世界はこう変わる』という本では、これまでに多くの研究者によってなされた膨大な研究を下敷きに、この生成AI革命のなかで知っておくべき技術、影響、未来に関して論じたものです。AIを研究する身としては、生成AIのポジティブな面のみを強調したいところですが、考えられるリスクについても隠さずお話ししたつもりです。

 そして、本書で強調したいもう1つの視点があります。技術的なツールとしてだけでなく、この世界に初めて誕生した(または、するかもしれない)人間と同等以上の「知的存在」として、生成AIを考えるというものです。その発展の速度を考えると、現代を生きる私たちは、歴史上で初めて人間より賢い存在を目撃する可能性があります。それが最終的に「生成AI」と呼ばれているかどうかはわかりませんが、少なくとも今の生成AI技術がベースになることは間違いありません。

※本記事は『生成AIで世界はこう変わる』の第1章の一部を抜粋、再編集したものです

◎目次
第1章:「生成AI革命」という歴史の転換点
──生成AIは人類の脅威か? 救世主か?
・「生成AI」とは何か?
・「この世にない新しいもの」を生み出せる
・ChatGPTは「汎用技術(GPT)」?
・史上最速で社会変化をもたらす「生成AI革命」
・人間を超えた「超知能」の誕生も現実的に
・本書の目的と構成

第2章:生成AIの背後にある技術
──塗り替わるテクノロジーの現在地とは?
・第一次ブームの「探索と推論」第二次ブームの「エキスパートシステム」
・第三次ブームを起こした「ディープラーニング」とは?
・機械学習の分類と「自己教師あり学習」
・ChatGPTはどのように情報処理をしているのか?
・言語モデルは「穴埋め問題」を解いて学習する
・「正しい回答」が「好ましい回答」とは限らない
・人間によるチューニングと半自動的な学習
・言語モデルを実現するニューラルネットワーク「トランスフォーマー」
・AI研究をお金の問題に変えた「スケーリング則」とは?
・大規模言語モデルで起こる「能力創発」
・良い回答を引き出す「少数例プロンプティング」と「思考の連鎖」
・言語生成に次いで伸長する動画像生成AI
・ノイズを除去して画像を生成する「拡散モデル」
・ノイズを予測する学習をもとに除去を繰り返す
・拡散モデルの「条件付き生成」とは?
・音声・音楽生成AIの発展も進む
・発展の先にある「マルチモーダルモデル」と「AIエージェント」
・言語生成AIにとっての新しい検索エンジン

第3章:AIによって消える仕事・残る仕事
──生成AIを労働の味方にするには?
・長らく議論が続く「AIによる労働への影響」
・「雇用の未来」が示した「全職業の47%に影響」という衝撃
・「ホワイトカラーこそが影響を受ける」とした「GPTs are GPTs」
・「ポランニーのパラドックス」が示唆するコンピュータの限界
・AIなら「非定型作業」でも代替できる?
・生成AIでも代替できないのは、頭を使わない簡単な作業?
・機械化・AI化によって「仕事が奪われる」とは限らない
・生成AIは労働補完型か? 労働置換型か?
・生成AIによる生産性向上を示す複数の実験結果
・すでに生成AI導入が進む「カスタマーサービス」分野
・AIにより「カスタマーサポート」の質・生産性・満足度が向上
・すでにプログラマーの仕事の半分は自動化されている?
・プログラミング言語を使わなくてもプログラミングが可能に?
・営業や販促における生成AIの活かし方とは?
・研究者は積極的に生成AIを取り入れている
・健康管理や趣味にも活かせるツールに
・生成AIは教師や教材の代わりになる?
・AIが医師の診断を上回る項目も?

第4章:AIが問い直す「創作」の価値
──生成AIは創作ツールか? 創作者か?
・素人にもイラスト制作の依頼がくる時代に?
・「AIは創造性を持つか?」をめぐる長い議論
・「組み合わせ」「探索」「革新」という3つの創造性
・人間が行う無意識のインプットは、AIにとっての「学習」?
・人間ならではの「ストーリー」抜きに「創作」はできない?
・「創作ツール」としての生成AIの画期性
・新技術は新たな文化の発展をうながす
・ビジュアル制作も音楽制作も生成AIで自由自在に
・「AIキャラクター」や「AI Tuber」も登場
・プロのクリエイターにも、多大な恩恵をもたらす
・アイディア出しツールとしての利用も進む
・AIがつくった作品に価値を感じられるか?
・「人間がつくったかどうか」が最大の価値基準?

第5章:生成AIとともに歩む人類の未来
──「言語の獲得」以来の革新になるか?
・AIに聞けば、すべての疑問が解決する?
・アイディアさえあれば、なんでも実現できる?
・人間は「人間にしかできない」ことに集中する?
・生成AIは学習データを無断で使用していいのか?
・強く規制すると、あらゆるサービスの利用が阻害される
・デジタルコンテンツは本物と偽物の区別がつかなくなる?
・情報の送り手と受け手のつながりが希薄化する?
・人類の歴史を劇的なものにした「言語の獲得」
・ディープラーニングが「眼の誕生」なら、生成AIは「認知革命」
・「超知能」の前では、凡人とアインシュタインの差すらも無意味に?

特別対談:松尾豊×今井翔太
──生成AI時代に求められるスキルとマインドとは?
・AIがもたらす未来は、予測不能な高次の領域に
・メタ認知を上げて、戦略的思考を身につけろ
・国に頼るのではなく、未来の舵は自分で握れ

SBクリエイティブ株式会社
問い合わせ先:https://www.sbcr.jp/contact/
会社概要:https://www.softbankcr.co.jp/ja/info/profile/
プライバシーポリシー:https://www.softbankcr.co.jp/ja/privacy/

著者・今井翔太
1994年、石川県金沢市生まれ。東京大学 大学院工学系研究科技術経営戦略学専攻 松尾研究室 に所属。博士(工学、東京大学)。人工知能分野における強化学習の研究、特にマルチエージェント強化学習の研究に従事。ChatGPT登場以降は、大規模言語モデル等の生成AIにおける強化学習の活用に興味。著書に『深層学習教科書 ディープラーニング G検定(ジェネラリスト)公式テキスト 第2版』(翔泳社)、『AI白書2022』(角川アスキー総合研究所)、訳書にR. Sutton著『強化学習(第2版)』(森北出版)など。