見出し画像

AI時代に起業するということ

生成AI以前と以後で、会社のあり方は決定的に変化していくのだと思う。
たとえば、昨日はとある会議で、「この(AI)サービスの原価はいくらか」という議論が沸き起こった。

AIサービスなのだから、AIの利用料くらいしかかからないかというとそうでもない。実際、AIを動かすためにはAIそのものにかかるお金以外の人件費がかかる。誰かに売る人の人件費や、システム開発のための人件費や、サポートのための人件費だ。ただ、AIサービスの場合、人件費を極限まで最小化することができる、という点が決定的に違う。

また「AIの利用料」も、「APIの利用料」なのか、ベアメタルサーバーの月額利用料なのか、それとも自社に持っているGPUマシンの電気代なのか、という議論のポイントがある。

あまり多くの人は語らないことだが、実は起業には再現性がある。
つまり、一度でも事業をうまく立ち上げたことがある経験を持つ人は、次も事業をうまく立ち上げる可能性が高い。

反対に、何度も事業を立ち上げては何度も失敗する人もいる。
この違いは、基本的にはその人の本質的な性質が影響している。

よく言っていることだが、日常的にキャッシュフロー表を見ない、もたない経営者は事業をうまく立ち上げることができない。経営者にとってキャッシュフロー表は学生にとっての通知表、社会人にとっての家計簿みたいなものなので、見ていると誰でも滅入る。それはわかる。しかしキャッシュフローを見るということは現実を直視するということで、経営とはとことん現実である。現実を見ることができない人に経営をすることはできない。

キャッシュフロー表を経営者が毎日見なくなるのは、事業が安定して、経営状態がずっと上向きの状態の場合のみだ。

キャッシュフロー表はいろいろなことを教えてくれる。
たとえば会社があと何ヶ月、または何日生存できるか。
起業時の経営者は常に頭の中にデッドラインを意識していなければならない。その企業余命デッドラインを事業の売上で伸ばすのか、それとも外部からの資金調達で伸ばすのか、資金調達するとしても銀行や信用金庫から借りるのか、ベンチャーキャピタルから調達するのか。

よくありがちなのが、ごく初期に新株発行によるエクイティでまとまったお金を調達してしまい、その後ただお金が溶けていくだけの状態になってしまうことだ。資金調達の方法をエクイティしか知らないので会社のデッドラインを伸ばすためにまたエクイティを繰り返さなければならない。もちろん、いつまでもそんなことは続けることはできない。どこかで限界が来る。

マイナス金利が長く続いた時代は、猫も杓子もお金を出したがった。そりゃそうだ。お金を貯金しているだけでは損しかないわけだから。銀行もベンチャーキャピタリストもどんどんお金を出したがった。まるでお金を押し付け合うように。でもそんな時代はもう終わった。

生成AI戦争の最前線では見たこともないような大金がエクイティで飛び交っている。出口をなくしたお金たちが全力でNVIDIAに吸い込まれていく。ただ、みんな本当は気づいている。「このやり方で本当に勝てるのか誰もわからない」と。

あるタイミングで生成AIバブルが弾ける。しかもそれはけっこう早いと思う。あるとき、「待てよ。結局利益を出した会社はあったのか?」と立ち止まって考えた時、全世界が熱狂から醒める。

昔、「土地の値段は上がることはあっても下がることはない」と考えた人たちが大勢いて、それが弾けて大変なことになった。今は、「NVIDIAのGPUをたくさん持っていれば勝てる」と思ってる人が大勢いて、大金が投じられている。これは土地以上に危険な賭けだ。土地はたとえ値段が下がっても場所として残るし、維持費も固定資産税くらいしかかからないが、NVIDIAのGPUは買ったら買ったで、それ以上に使い道を見つけなければならず、大量のGPUを使い続けるには大量の電力が必要になるのだ。そして大量の電力を使い、世界で最も高性能なAIを作り出すことができたとして、それが未来永劫唯一無二の存在になれるかどうか、誰も保証してはくれないのである。

たとえば去年あれだけみんなが熱中したGPT-4は、今年に入ってClaude-3に乗り換えられた。少なくとも僕は今の所GPT-4を使い続けるよりはClaude-3の方が便利だと思い始めている。そうこうしているうちにCommand-R+という、性能はGPT-4並でスピードはずっと速いAIが現れた。値段も安い。たった一年で二回も世代交代が起きている。細かいバージョン違いを入れればもっとだ。この世界で勝つためには、Microsoftのように、GPT4のOpenAIにもClaude-3のAnthropicにも賭け金を張るしかない。たぶんCommand-R+のCohereにも張ってるだろう。この勝負、誰が勝っても勝てるようにするには、全部に張るしかないのだ。しかしこの「全部」というのも曲者で、突然、誰も知らないベンチャー企業がもっといいものを作り出してしまうかもしれない。

興味深いのは、投入金額と成果が正比例しているように見えないことだ。
ここにはかなりの非対称性がある。本当の勝負はこの先かもしれないが、OpenAIがSoraの一般公開を(いつものように)出し惜しみしている間に、オープン版のOpenSora-Planが出てきてしまった。世界で最もGPUを集めたMicrosoftが全面的に支援しているOpenAIは、必ずしも生成AIの絶対王者とは思われていない。

ある程度の規模の計算資源を持つことは、「出場チケット」ではあるとしても、その規模が大きければ大きいほど勝てるとは限らない。これまでシリコンバレーは主に人材をライバル企業にとられないように不必要なほど大量に抱えていた。今はこれがGPUになっただけとも言える。過当競争の状態なのだ。

学習のためのアルゴリズムは自動的に進化し、世界の誰かが毎日、安く、速く、確実に学習できるような方法を編み出している。このアルゴリズムを秘匿することに価値はほとんどなく、誰かがあるアルゴリズムを隠したとしても、他の誰かが必ず同じかもっとマシな方法を編み出し、オープンソースで公開してしまう。

つまり、学習するためのGPU資源に価値があるのはこれからあと数年しかないはずだ。毎日のように新しい学習アルゴリズムが発表されている状況を考えればこれは不自然なことではない。Midjourneyが最初に登場した時、天文学的な学習資源が必要だと主張され、誰もがそう考えたが、予想よりずっと安いコストでSatbleDiffusionが作られ、公開され、StableDiffusionを微調整ファインチューニングする手法はあっという間に解析され尽くされ、ノートパソコンですら簡単に画像生成ができるようになった。しかも微調整にかかるデータセットの数はそれほど重要ではなく、質が最も重要になる。

OpenAIもその他の生成AIベンチャーも、必死にGPUを集めているように見せているが、その実、「コンテンツ不足」に困っている。もう世の中に読むべきデータは全て読んでしまった。だから数百万時間にわたるYouTube動画を学習するしかなくなってきている。

https://twitter.com/ImAI_Eruel/status/1768285142689431717

GPT-4もClaude-3もGeminiも、おそらく実用性が高いと考えられているAIの殆どは、本来は著作物であるはずのデータをインターネットに限らず大量に読んでいる。実際にGoogleはむしろそのためにこそYouTubeを傘下に収めたのであり、Google Booksのようなプロジェクトも進めていた。日本国内で書籍などの著作物をAIに学習させる試みは今のところ皆無であり、このままでは諸外国との差がどんどん開いていく。

日本国内で書籍や動画などの著作物をAIが学習するのは完全に合法だが、法とは別の話として、特に我が国にはそうしたことに嫌悪感を抱く人々もいる。日本国内で内輪揉めしている間に、アメリカで、中国で、ロシアで、日本の著作物は勝手に学習されていく。すでにアメリカではGPT-4を開発したOpenAIが、英国ではStability.aiが、それぞれ著作権者から訴訟を起こされている。わが国と違い、それらの国々には著作物に対するAI学習の扱いが法的に定まっていないからだ。

一番重要なのは、学習するデータの量よりも質である。
学習データの質に着目すれば、小規模な計算資源(例えばわずか8つのA100 GPU)でも四日間で高性能なLLMが作れることをMicrosoftが証明している。

この論文によれば、わずか1.3B(13億パラメータ)のモデルでも、学習データの質にさえ気をつければ人間の評価(Human Eval)でGPT-3.5(175B)よりも高いスコアを達成できると指摘されている。

世界で三番目くらいにGPUを持っているイーロン・マスクはTwitterの呟きを学習させた結果、規模は大きい(314B)のにあまり高性能とは言えないGrokを作った。投じられたお金はGPTやClaude-3にひけをとらないはずだが、Grokの性能はそのほかのライバルに大きく水を開けられている。やはりこれはTwitterに寄せられている投稿の多くが感情的な呟きだったり断片的な情報だったりするということが大きな原因だろう。

要は実際に「高性能なAI」を作るためには、「データの質」が決定的に必要なのだ。「質が高いデータ」をどのように集めるか、それが最も重要なことだ。

僕はこのような時代に真の価値を持つのはGPUでもアルゴリズムでもなく、「データ生成能力」だと思う。「コンテンツ生成能力」と呼んでもいい。

この「コンテンツ」を作る時に、重要なのは「欲しいAIの目的」である。例えば「科学的に正しいことを考えるAI」が欲しいなら科学の教科書を読ませるか、AIに向いた新しいタイプのコンテンツを作る必要がある。例えば、今のAIはLaTeXのような数式記述の記法やPythonなどのプログラムについては豊富な知識を持っているが、「三平方の定理を図示せよ」とかという図形問題は苦手としている。この壁を乗り越えるには「言葉とそれによって生まれる図形を総合的に理解する」機能、いわゆるマルチモーダル機能が必要になるが、これはまだ発展途上にある。

多くの科学者にとって、本当に欲しいのは「科学的知識のあるAI」なのかというと、僕は少し違うのではないかと思う。「一緒に科学的議論が可能なレベル」のAIは欲しいだろうが、それには教科書だけでは足りなすぎる。教科書というのは基本的には「すでにわかったこと」だけを書いてあって、科学というのは「これからわかりたいこと」が主な研究目的になるからだ。

「科学的発見」をするAIの開発は、僕個人の能力の範囲を大きく逸脱してしまう。それはどこぞの大学や軍隊か国家的研究機関に任せる方がいい。

それよりも知識や叡智が体系化されておらず、しかも人々の生活を根本的に変える、または支えることになるのは、「人が生活し、飯を食っていく方法」つまり「経営」を理解するAIだと考えている。そしてこと「経営」ということに関しては、正解データのようなものは世界のどこにも存在しない。「このようにやれば必ず上手くいく」というような経営学の本はない。経営学というのは、自然科学のように、「起きてしまったことの理由を説明する」学問であって、「これから起きること」を言い当てる学問ではないからだ。

そして僕は人工知能の研究家であると同時に経営の研究家でもある。そしてもしも経営について、半分とは言わないまでも最低限の割合、20%でもいい、助けてくれるようなAIがあれば、それはベンチャーキャピタルの期待する成功率33.3%を大きく引き上げることになるだろう。どんなベンチャーキャピタルでも、投資対象の2/3は事業に失敗することを前提に設計されている。しかしそれはおかしい。なぜなら、再度指摘するが、起業には再現性があるからである。起業には再現性があるという根本的な性質を無視して闇雲に事業プランを評価してもその事業のポテンシャルはわからないし事業を軌道に乗せる方法もわかるわけがない。

そうしてこれはある側面で言えば「市場のゼロサムゲーム」を戦うことになるので、その瞬間はできるだけ少人数で秘匿したノウハウであった方がいい。

経営の方法を本に書いて出版するなどということは現役の経営者がするべきではない。これはヤマト運輸に宅急便を導入した小倉昌夫も自著の中で言っている。彼がこの本を書いたのは、経営から退いたからだ。

そのためには、YouTubeやそのほかの手段で見ることのできない、生のデータを作ることが必要だ。

あまりに多くの人に知れ渡って仕舞えば、問題が起きたり発言の揚げ足を取られたりして本質的な議論に踏み込むのが難しくなる一方の現代の状況を鑑みれば、経営の真の課題、現代経営の方法論、そしてAI時代にどう対応していくかというリアルタイムの経営学を限りなく現役に近い経営経験者が、授業し、論じたことをAIに学習させることは、遠回りなようでいて唯一の勝ち筋であると考えている。

もちろん、この授業は決してリアルタイムではオンライン配信せず、GoolgeやそのほかのAI開発企業がデータとして流用しようとしたとしても流用できないようにする必要がある。

そのために、一見すると時代に逆行した考え方のように見えると思うが、リアルな授業を開催する必要がある。しかもできるだけ少人数で、クローズドで、オンライン配信されないものだ。オンライン配信すれば、他の企業に盗まれてしまう可能性すらあるからだ。

AIを作るには、まず目的を定めることが重要だ。その意味で、僕の目標の一つは経営するAIを作ることだ。感情や個人的な欲求に支配されないAIが経営をやるのが最も合理的だからだ。

そこでAIのための経営塾を開くことにした。人間も聞くことができるが、現地に行かないと参加できないように敢えてしてある。

講師はYahooJapanの広告販売を最初に手がけ、東証プライム企業となった会社をゼロから立ち上げた人から、はてなブックマークを始め数々のWebサービスのマネタイズに成功してきた人物などを皮切りにシリーズとしてやっていく。

今後もいろいろな人を講師として招いてAI時代の起業論・経営論について考えようと思う。第一回は4月25日の予定です。