見出し画像

『Stable Diffusion』を提供する奇妙な新興ユニコーン、Stability AIの正体

こんにちは!Dawn Capitalインターンの八並映里香です。
本稿では世界が注目するジェネレーティブAI分野の最新ユニコーン、Stability AIについてご紹介します。

ジェネレーティブAIスタートアップに関しては、まずはここを抑えるべし』というような旬のユニコーンですので、当該分野のキャッチアップに是非ご活用ください!
【読了時間目安:9分】


今年上半期において、2022年は『Web3元年』であると言われていました。
しかし、世界2位の仮想通貨取引所『FTX』の経営破綻など界隈市場の冷え込みが目立つ中、時流は別の意見に覆ってきているようです。

(引用:Unsplash

DIAMOND SIGNALは『2022年は「画像生成AI元年」?』という記事を発表し『2022年に入って立て続けにGoogleや新興のAI開発企業から「画像生成AI」が発表・公開されている』とコメントしたほか、

The New York Timesも『ジェネレーティブAIアプリケーションにとって今年は飛躍の年だった。NFT や仮想現実のメタバースとは異なり、これを正当化する事実や数字がいくつもある』と報じています。

前回記事でもお伝えしたようにMicrosoftAmazon AWSGoogleMetaといったビックテックの熾烈な開発競争が一日刻みで顕在化し、多数のジェネレーティブAIスタートアップの勃興が注目される2022年の海外スタートアップ業界。

米国の超巨大ファンド、セコイア・キャピタルのパートナーによって早くも作成された
ジェネレーティブAIスタートアップのカオスマップ。
(引用:https://twitter.com/sonyatweetybird/status/1582040028015837187?s=21&t=i35w0WAHuoLYqoGQT5_iUg)

その中でも一際存在感を放つ新興巨大ユニコーン、Stability AIは一体どんなスタートアップなのでしょうか?


Stability AI基本情報

(引用:公式HPより)

評価額:10億ドル
直近資金調達額:1億100万ドル(2022年10月17日)
総資金調達額:1億1100万ドル
シリーズ:A
リード投資家:
Coatue ManagementLightspeed Venture PartnersO'Shaughnessy Ventures


設立2年で10億ドルのユニコーンに

(引用:https://techcrunch.com/2022/10/17/stability-ai-the-startup-behind-stable-diffusion-raises-101m/)

The New York Timesは、『Stable Diffusionほど多くの話題や論争​​を巻き起こしたジェネレーティブAIプロジェクトはない』と断言しています。

2022年8月に彗星の如く現れ、瞬く間にネットの話題を攫ったStable Diffusion
DALL-E 2、Midjourneyなど作成者によって慎重に保護されている画像生成AIとは異なり、Stable Diffusionは『オープンソースで開発され、かつ一般公開されている』という点で一線を画しています。

上記の点はユーザー獲得戦略の肝となり、NY Timesの言葉を借りるならば『その自由さが特にアンダーグラウンドアーティストミームメーカーの間でヒットした』ことがブームの火付け役となりました。
その上、
・どんな画像が出力されるかわからない意外性、ワクワク感
・AIを訓練するほど上がってゆく画像のクオリティ

が多数のヘビーユーザーを生み出しています。

そんなStable Diffusionを提供するStability AIは2022年10月17日、10億ドルの評価額で1 億100万ドルの資金調達を発表。
2020年の会社設立から、2年弱でユニコーンへの階段を一気に駆け上りました。

これを受けて同社はサンフランシスコで同社のローンチパティーを開催し、Googleの共同創設者であるSergey Mikhailovich Brin氏、TwitterやNotionに初期段階から投資するAngelList創設者のNaval Ravikant氏といった業界の著名人もZoomを通じて参加しています。

NY Timesは本パーティーを『ジェネレーティブAI分野の大規模なカミングアウトとして機能した』と大々的に報道し、テック業界に多大なインパクトを与えました。

BloombergによるとStable Diffusionは10月のプレスリリース時点で20万人以上がダウンロード・1日1000万人以上が利用しているほか、ブラウザ版Webサービス『Mage』も登場し更に世界規模の人気を博しています。

Mageと同じブラウザ版かつ商業利用・画像解像度の選択も可能なDreamStudioは、有償版サービスにも関わらず50 か国以上から150万人を優に超えるユーザーを獲得し、計1億7000万以上の画像を作成しました。

CEOのEmad Mostaque氏は『世界中のあらゆるクリエイティブ企業が今、Stable Diffusionにトライしている。インタラクティブで個人に最適化したコンテンツは、何年も前から期待されていた。これは、それを実現できる最初の技術だ』と語っています。

(引用:https://www.mage.space/)

Fobesによると当初リードVCのCoatue Managementとは評価額を5億ドルと交渉していましたが、後に他リードVCのLightspeed Venture Partnersとの交渉で評価額を2倍の10億ドルまで跳ね上げたとのことで、その凄まじい勢いが伝わることでしょう。

資金調達の背景については各投資家ともコメントを公表していませんが、今回のリードVCはいずれもテクノロジー特化・シード投資特化の歴史あるVCであり、Stable Diffusionは感度の高い投資家筋の間で『知る人ぞ知る』会社として注目されていたことは間違いありません。

AI企業なのにテック勤務経験なし?『奇妙な』CEO

CEOのEmad Mostaque氏。オックスフォード大学出身
(引用:https://www.realvision.com/blog/emad-mostaque-talks-stability-ai-with-raoul-pal)

Stability AIの発案者かつCEOのMostaque氏についてNY Timesは、『ジェネレーティブAI業界の奇妙なフロントマン』と評しています。

数学とコンピュータサイエンスの修士号を取得してオックスフォード大学を卒業した彼は、英国の元ヘッジファンドマネージャーとして過去 10 年間の多くを石油の取引に費やしてきたほか、中東戦略とイスラム過激主義の脅威について企業や政府に助言を行ってきました。

(引用:Unsplash

上記の通り彼は博士号を持っておらず、GoogleやOpenAIのように大規模なAIプロジェクトを有する大手テクノロジー企業で働いたこともありません。

オックスフォードでの数学とコンピュータサイエンスという学問的バックボーンに加えて、
・AIへの個人的興味
・オープンソースAIコミュニティにおける『組織的秩序』の欠如に対する問題意識
が彼をこの分野への駆り立てたとTechCrunchは報じています。

さらに彼は、DIAMOND SIGNALの取材で興味深い原体験を語っています。

(引用:Unsplash)

私にはアファンタジア(視覚的なイメージを頭の中で思い浮かべられないこと)という症状があります。例えば「砂浜」と聞いても、それを頭の中で思い浮かべられません。なのでStable Diffusionは私のような症状を持つ多くの人々にとっては素晴らしい発明だと言えます。頭の中で感じていたことを初めて見ることができるのですから。

太字加工は筆者による

このような彼の特性は、Stable Diffuion開発にあたっての潜在的ヒントになり得たのでしょう。
また同取材にて彼は、

私たちはスタートアップとして数年前より活動してきましたが、本格的な活動を開始したのは9カ月ほど前です。
従業員数は75人で、世界で10番目に速いスーパーコンピューターを保有しています。そして2万人ほどの開発者のコミュニティを形成しています。Stability AIはとても奇妙なスタートアップなのです。

太字加工は筆者による

とも話しています。

REALVISIONの取材の中で彼は、『パブリックスーパーコンピューターであるEzra-1の構築と、Stability.aiの構築にすべての資金を費やした。』と語っており、サービスローンチまでに技術的分野に多額の投資をしていたことが伺えます。

実際にEzra-1はStable Diffusionの屋台骨の一つとして機能しており、Stability.aiが主導するあらゆるAIコミュニティ(公式HPに多数記載)と共にサービスの質を担保しています。

同社は最近ではGoogle Brainの研究科学者や作家・システムアーキテクトのDaniel Jeffries氏を採用したほか、ビッグデータを使用して政府が Covid-19についてより適切な決定を下せるようするシンクタンクとテクノロジー同盟を結びました。

加えて2022年11月30日には、Amazon AWSとの提携を発表。
Amazon SageMakerを使用して基礎モデルを58% 高速化しコスト効率の向上を図るほか、
オープンソースのツールとモデルを世界中の学生、研究者、スタートアップ、企業が利用できるようにするという展望を描いています。

(引用:https://techcrunch.com/2022/11/30/stability-ai-doubles-down-on-aws/)

異例づくめの奇妙なCEOと、多方面での強化・拡大を続けるチームがこれから描いていく斬新な青写真に注目です。


OpenAIよりも『オープン』なAIを

(引用:公式HPより)

《AI by the people, for the people》
———
 人民による、人民のためのAI

こちらはStability AIの公式HPを開くと真っ先に現れる、当該企業の理念を体現した文言です。このフレーズ、どこかで聞いたことがありませんか?

《government of the people, by the people, for the people》
———
 人民の、人民による、人民のための政治

元ネタであろうこちらは米国大統領リンカーンが1863年11月、ペンシルベニア州のゲティスバーグで行った演説のなかの言葉で、民主主義政治の原則を示したものです。
Stability AIがこの言葉を引用したのは、ひとえに『AIの民主化』を第一目標として掲げるがゆえでしょう。

(引用:https://www.azquotes.com/quote/176091)

Stable Diffusionというサービスの最も特異な点とは、前述の通り『オープンソースである=誰でも無料で使うことができる』という点です。

CEOのEmad Mostaque氏は『企業の影響力から解放された、民主化された AIというビジョンを達成するには急進的な自由が必要である』と語り、誰にでも解放されたサービスであるStable Diffusionの意図を強調しています。

それではなぜ彼はこのようなビジョンを掲げているのか?
答えは、世界規模でのAI業界全体が抱えている以下の課題感にあります。

・ビックテックによる強権的なアプローチ
・AI分野における高い参入障壁

同氏はローンチパーティーにてGoogleやFacebookなどのビジネスモデルの中核である『ターゲット広告』を非難した上で、これらの企業とは異なりStability AIはユーザーをスパイし、監視することはないと断言しました。

 GAFAMといった中央集権的テクノロジー企業に逆行する流れは、『分散型』『非中央集権』というキーワードを擁するWEB3に通じるものがあります。

(引用:https://coinmarketcap.com/alexandria/article/what-is-web-3-0)


また同氏は、大規模なAI開発組織が技術を独占しているせいで個々の技術者がなかなか独力で開発に踏み込めず、AI業界でブレイクスルーが起こせない構造になっていることを批判しています。

例えば2015 年Sam Altman氏とElon Musk氏は、AI を民主化しその研究とモデルを一般に公開するという、一見Stability.aiと同様の動機を持つ企業OpenAIの設立を発表しました。

しかし同社によるによるDALL-E2はオープンソースではないためユーザーは多額の請求を逃れられず、Mostaque氏はまさにこれを問題視しています。

こういった観点から彼は『人類はプライベートAIとオープンソースAIのどちらかを選択しなければならない』と主張し、オープンソースAIこそがテクノロジーの方向性に大きな影響を与えると確信した結果、Stability AIはAIの民主化を追求しているのです。


マネタイズの鍵は『パーソナルStable Diffusion』と『クリエイターエコノミー』

(引用:Unsplash

Stability AIは、

・企業・国家規模での『パーソナルStable Diffusion』の構築
・個々人間での自発的なクリエイターエコノミー構築

をマネタイズの軸にしようと試みています。

Mostaque氏はDIAMOND社の取材で『Stable Diffusionは幅広くさまざまな用途に活用できるため、広告モデルでの展開には利点がない』と語った上で、『コンテンツ制作企業を対象にビジネスを展開していく方針』であると同社のビジネスモデルを語っています。

具体化すると、Stable Diffusionの実務的使用の実例としては
・メタバースにおけるアプリケーション設計
・PowerPoint用のプレゼンテーション資料作成
などが挙げられており、まさにあらゆるコンテンツに当該AIは汎用性を保つことができます。

さらにAnalytics India Magazineでは、『Stability AIは複数の管轄区域のさまざまな政府や主要機関と協力して、これらの国とそのコミュニティ向けのAI を構築する』と語っています。

すなわち、あらゆる国・地域・会社の顧客向けにパーソナライズした『プライベート』Stable Diffusionを作成し、インフラストラクチャレイヤーとして機能させることで収益を上げるというビジネスモデルの展開に、同社は挑んでいるのです。

Mostaque氏は、機械学習エンジニア兼YouTubeパーソナリティのYannic Kilcher氏とのインタビューで、『この技術を販売するために政府や主要機関とのパートナーシップをすでに結んでいる』『私たちは大規模な取引を交渉してきたので、ほとんどの赤字大企業と比べてすぐに利益を上げることができる』と主張しています。

さらに、クリエイターが独自モデルで生成したコンテンツや、独自モデルの特性を他のクリエイターに販売するマーケットプレイスも構築予定だと言います。
例えばあるクリエイターがピクセルアートに特化したモデルを作ったとしたら、ピクセルアートに関するアセットを求めるクリエイターは、汎用モデルではなく独自モデルを求めるといった例が挙げられます。


補足として、冒頭でもご紹介した有料版サービスDreamstudioに関しては、売上は今後の成長基盤の一つとなれどもマネタイズの軸にはならないのではないかと考えられます。
同サービスは£10/画像約1000枚の従量課金製を取っており、既に150万人を超える課金ユーザーを有しています。

しかし、2023年には100枚の画像を1セント(約1.4円弱)で作成可能にしたいとの展望を同社は掲げており、こちらのサービスは極めて良心的な価格で消費者にAIを提供したいという理念の柱になる可能性が高いでしょう。


テクノロジーがクリエイティブワーカーの仕事を奪うのではないかと心配する一部のAI 批評家とは異なり、ジェネレーティブAI を何十億もの人々の手に渡せば、新たな創造の機会が爆発的に増えると考えるMostaque氏。

Stability AIの今後の成功の是非に、『ジェネレーティブAI』が単なるバズワードで終わるか否かが懸かっているのかもしれません。



いかがでしたでしょうか?
今回は注目スタートアップを絞ってご紹介しましたが、ジェネレーティブAIのスタートアップに関しては日々多様なカオスマップが生じています。

下記の情報は当該分野のスタートアップ・カオスマップや表をまとめたサイトになりますので、興味のある方はぜひ参考にしてください!


【セコイア・キャピタルによるジェネレーティブAIカオスマップ】

【ジェネレーティブAIのテキスト/画像/音声/動画生成機能に関するスタートアップを表にしてまとめたサイト】

【これから流行りそうな要注目のスタートアップ6選をまとめたサイト】

【ゲーム関連に特化したジェネレーティブAIのスタートアップをまとめたサイト】




文・リサーチ/八並映里香
写真・クリエイティブ/池田龍之介


【これまでのジェネレーティブAI関連記事】

イチオシ:国内・海外企業におけるジェネレーティブAIの開発・活用事例
(読了時間目安7分)

ジェネレーティブAIの具体的機能や使用リスクについて
(読了時間目安7分)

ジェネレーティブAIの定義や仕組みについて
(読了時間目安5分)