シリコンバレーも大注目の海外トレンド、ジェネレーティブAIとは何か?国内・海外情報をまとめてみた
こんにちは!Dawn Capitalインターンの八並映里香です。
今回は、Dawn Capitalでの仕事で学んだ海外スタートアップのトレンドを紹介していきたいと思い、noteを執筆しました。
本稿では米国のトップVCや有名投資家が大注目している最新技術、『ジェネレーティブAI』の定義や仕組みについてについてご紹介します。
【読了時間目安:5分】
実はこのnoteの見出し画像は、『Dawn Capital』というワードをもとに、ジェネレーティブAIによって作成されたものです。
他にも当該AIの使用例としては、最近Twitter上などで『#stabledifussion』『#AIピカソ』といったハッシュタグと共に多数投稿されている、AIが描いた秀逸なアートワークが身近な例として挙げられます。
しかし、そもそもジェネレーティブAIとはいったいどんな技術なのか?
なぜ、こんなにも話題になっているのか?
本稿では、これらの疑問を詳細に紐解いていきます。
ジェネレーティブAIとは何か?
『ジェネレーティブAIとは、データから人工物の表現を学習し、それを用いて、元のデータとの類似性を保った全く新しい人工物を生成するAI技術のことである。』
こちらは、英国の老舗調査企業Gartner社が発表した『5 impactful Emergency Technologies for 2022』という著名なレポートにおける定義です。
当該AIが生成できる『人工物』は、画像・動画・文章・音声・3Dモデルに至るまで多岐に及びます。
Gartnerは『市場全体に破壊と変革をもたらす、インパクトの大きい2022年の先進テクノロジー・トレンド』としてジェネレーティブAIを取り上げました。
当該AIにGartnerが割り当てたキーワードは『生産性革命』です。詳細については次の項目で後述しますが、これが世界的な注目の肝となっている部分です。
Gartnerは、ジェネレーティブAIの市場投入までの期間は6~8年を費やすと予測しました。
投入準備期間こそかなり長めですが、ジェネレーティブAIは科学的発見と技術商業化の両方の観点で急速に進歩を遂げており、
『ライフサイエンス、ヘルスケア、製造、材料科学、メディア、エンターテイメント、自動車、航空宇宙、防衛、エネルギー』
といったあらゆるインダストリーで活用が探求されています。
また米国とウクライナに拠点を持つエンジニア集団Altexsoft社は、同社の記事でGartnerの主要な予測として以下の文をピックしています。
さらに、AppleやGoogleに投資する米国VCセコイア・キャピタルもジェネレーティブAIを単体で特集したブログ記事を投稿しました。
セコイアは、
『ソーシャルメディアからゲーム、広告から建築、コーディングからグラフィックデザイン、製品デザインから法律、マーケティングから販売まで、人間が独自の作品を作成する必要があるすべての業界』
にこのAIが浸透することを示唆しており、
『ジェネレーティブ AI には、数兆ドルの経済的価値を生み出す可能性がある』とコメントしています。
また、『なぜシリコンバレーはAIが描いたぎこちない絵に興奮しているのか?』というユニークなタイトルの解説記事がCNBCから発表されており、各ファンドや個人投資家の反応からもジェネレーティブAIが単なるAI技術であるとは見なされていないことが伺えます。
客観的なデータとしてもAIや機械学習に関する論文は指数関数的に伸びてきており、その開発が加速してきています。
以上のようにジェネレーティブAIは、多種多様な業界の現状を根本からチェンジする可能性を秘めた、今後約10年間における注目イノベーションの一つであると言えるでしょう。
従来のAIとどのように違うのか?
- ジェネレーティブAIの仕組みについて
従来のAIとの違いについて理解するには、ジェネレーティブAIの仕組みを軽く解説する必要があります。
今回は前述したAltexsoft社の記事、およびアクセンチュアのBusiness & Technology Futuristによるこちらの記事を参考に説明していきます。
まず、現在のところ最も広く使用されているジェネレーティブ AI モデルは以下の 2つです。
今回は、近年の多くのジェネレーティブAIで導入されているGAN(Generative Adversarial Network)と呼ばれるテクノロジーについて軽く解説します。
GANは、『生成ネットワーク』と『識別ネットワーク』から構成されています。(記事によってgenerative network/ generatar model、discriminative network/ discriminatar modelと表現の違いがありましたが、ここでの表記はネットワークに統一します。)
それぞれのネットワークの役割は以下の通りです。
2つのネットワークは交互に繰り返し学習され、この過程で、生成ネットワークはよりリアルなデータを生成するよう学習し、識別ネットワークはオリジナルデータとそれにそぐわないデータを見分ける能力を高めていきます。
その結果、繰り返し学習させるごとに、合成データはオリジナルデータにどんどん近づいていき、本物の事物と区別がつかないような成果物が作成できるのです。
ジェネレーティブ AI のこの特性を利用した最も顕著な使用事例として、あたかも本物のように見える画像の作成が挙げられます。
2017 年に、NVIDIA Researchの非常に著名な研究者である Tero Karras氏は「Progressive Growing of GANs for Improvement Quality, Stability, and Variation 」というタイトルの論文を発表し、当該AIによる人間の顔の写実的な写真の生成を実証しました。
前述のAltexsoft社は同社の記事で、以上のようなジェネレーティブAIの特異性を『私たち自身の世界と不気味なほど似ている世界を、あらゆる領域で作成する』と表現しています。
- それでは、ジェネレーティブAIは従来のAIとはどう違うのか?
産業技術総合研究所のこちらのマガジンは、従来のAIがやっていることは既存の大量のデータから『特徴』を学び、『予測』をすることだと述べています。例えるなら、犬と猫の写真を大量にインプットし、その違いを区別する、といったことをやっています。
すなわち、skippetの記事の言葉を借りるならば従来の機械学習アルゴリズムは、
と言えます。対してジェネレーティブ AI は、
という、従来の機械学習とは全く異なる特性を持ちます。
そして、上記のようなジェネレーティブAIの特性をうまく活用できれば、
人間があらゆる事物の制作・分析・研究・探索にかけている生産コストが、圧倒的に削減される可能性が高くなります。
ゆえに当該AIの核心的キーワードは『生産性革命』だと言われており、またこれが世界的な注目の肝となっている部分なのです。
しかし、
・『人間があらゆる事物の制作・分析・研究・探索にかけている生産コストが、圧倒的に削減される』といっても、それはどのようなユースケースによるものなのか?
・便利なAI技術と言っても、何かデメリットを含んでいるのではないか?
との疑問も、多く出てくると思います。
そこで次の記事では、
について、詳しく解説していきます。
話題の最新ユニコーンや時事問題、著作権問題など非常に興味深い事例を多数取り上げておりますので、是非ご覧ください!
文/八並映里香
写真・クリエイティブ/池田龍之介