見出し画像

『ChatGPT対抗「FlexGen」がゲームチェンジャーになる理由まとめ』~【新しいweb3ビジネスのアイディアのタネ】2023.2.27

■ChatGPTで騒いでる場合じゃない。 AI研究者が「FlexGen」をゲームチェンジャーと呼ぶ理由

長年この分野を見てきた者としては「ちょっと沸きすぎ」のようにも見える。深層学習を使った会話ロボットは、何もChatGPTが初めてというわけではない。
ところが、世界中が驚かざるを得ないゲームチェンジャーが現れた。
その名も「FlexGen」と言う。2月15日に公開された。

ChatGPTの登場にはとても衝撃を受けました。
しかしこの記事の筆者は、テキスト系ジェネレーティブAI「FlexGen」がChatGPTの衝撃をはるかに上回るインパクトを与えると紹介されています。

ジェネレーティブAI、特にテキストチャット系AIの歴史や仕組みを非常に分かりやすく紐解いていて非常に読み応えのあり、実用面だけでなく構造から理解したい人はぜひ全文をお読みいただきたいと思います。

「FlexGen」がなぜChatGPTを上回る衝撃を与えるとしているのか、その要点は「ローカルで動く」ことに尽きます。

ChatGPTが超巨大なサーバで処理する必要があることの限界、
ジェネレーティブAIがローカルで動くと何が起きるのか、

この2点について取り上げられているところをかいつまんでご紹介したいと思います。


ChatGPTが超巨大なサーバで処理する必要があることの限界

H100は一枚475万円だから、推論だけで最低2300万円、学習するとなれば1億4千万円の機材が必要になる。到底、個人が手を出せる代物ではない。

さらに、言語モデルはどんどん大規模になっていくはずだ。2023年の今、ギリギリGPT3が動いたとしても、次のGPT、そのまた次のGPTはもっと巨額の設備が必要ということになる。電気代も膨大だ。

現在広く使われているChatGPT3.5というバージョンですら巨大で超高額なサーバ上で処理しなければならないことを指摘しています。

次のChatGPT4以降を処理するサーバは(ver3の延長線上のロジックだとすれば)もっと巨大・高額になるでしょうし、テキストより複雑な画像や動画のジェネレーティブAIを処理するサーバはもっともっと巨大だとしています。

ユーザー視点ではWebやアプリでAIを使うと結果だけが表示されるので普段は意識しませんが、AIが動作するためのサーバが巨大・高額だと当然利用料金に跳ね返ってきます。

最近「ChatGPTのAPIは公開されていないのに、ChatGPTを使っている」とうたうさまざまなサービスが国内外で登場してきた。もちろんAPIが既に公開されている「GPT3」を使ったサービスもある。が、それらは全てOpenAI(またはそのスポンサーであるマイクロソフト)に少なくない費用を払う必要がある。(サービス設計にもよるが)ビジネスモデル的には厳しい側面がある。

ChatGPTと「GPT3」は別物などややこしいところは置いておいても、現行のChatGPTをビジネス活用する場合はそれなりの費用がかかることが想定されます。

現在のある意味キャンペーン期間では戦略的に安価に設定されるかもしれませんが、超巨大な設備投資と過去のAI開発費用をペイさせられる本来料金は高額なはずです。

利用料金が高ければ、ChatGPTを活用したサービスを開発・提供するサードパーティの利用料金も高額になります。

提供料金を高く設定せざるを得ないとすると、ビジネス用途や超実用的な用途のものに限定される可能性が高くなります。

「巨大設備の費用がネックで、サードパーティ製のサービスを通じてChatGPTの利用用途が拡大できない」という弊害が1番目の指摘点です。


AI処理が軽量化されると何が起きるのか

GPT3級の大規模言語モデルが、パソコンで動くようになる

・会議の前に議事録を作るAI
・ユーザーサポートの高性能チャットボット
・大企業の社内文書AI(検索・自動要約)
・ゲーム内の村人と永遠に雑談できるロールプレイングゲームも作ることができる
・Minecraftのようなゲームでも、生物が自動生成されたり村人と会話したり村人同士が喧嘩したりするのを仲裁したりできるようになるかもしれない

ジェネレーティブAIが軽量化されるということを2つの側面に分類して、筆者が挙げられている事例をご紹介します。


1.巨大な設備を必要としないことでローコスト化できる側面
→ 
ゲームやお遊びなど気軽に使えるサービスに広がる

ChatGPTが世に衝撃を与えたのは、誰でも自由に使えたことだと思います。おかげでTwitterなどでバズる研究ネタになったこと、大学生の論文提出に使われて事件化したこと、「AIが仕事を奪う」実際の事例をもっともらしく見せつけられたことなどは、無料で誰でも使えたことにより起きた現象です。

これら無料で用途が研究された中から実際に商用サービス化されるものが生まれていきます。

しかしChatGPTを本格利用するなら本来はサーバ代が高額になるはずです。

「FlexGen」は一応現実的なレベルのローカルマシンで動作しますし、それをサーバ上で処理させるにしても安価なサーバ設備で済みます。おかげで気軽に使えるサービスが生まれやすくなります。


2.ローカルデータが使える側面

会議の議事録や社外秘のデータを基にした処理など、クラウド上にベースデータをアップするのがはばかられる利用用途でもAIが活用できるようになります。

自社専用の「FlexGen」オンプレミスサーバ環境またはローカルネットワーク上に用意し、秘匿性の高いデータを基にしたAI処理を行うのに際し、必要なサーバ設備が現実的な費用で済むようになります。

これにより特に企業や公的機関での利用が加速するはずです。


「FlexGen」はオープンソースライセンス

FlexGenはオープンソースライセンスの中ではもっとも制約が緩いライセンスの一つ「Apache2.0ライセンス」で配布されており、まさにオープンソースコミュニティの底力を見せつけられている格好だ。

巨大な設備を必要としないとしても「FlexGen」のソース利用自体にお金がかかっては元も子もありません。

しかし「FlexGen」はオープンソースで、どこかの企業が利用料金を徴収するモデルではありません。OSSの開発やメンテナンスコストが総じて不足している問題は置いておくとして、「FlexGen」を使ったサービスは実際に非常に安価に提供される可能性があります。

OpenAI&マイクロソフト陣営のChatGPT、Google陣営のBardなど競争が激化していますが、いずれも巨大な設備が必要だとしたら「FlexGen」の料金体系に太刀打ちできないかもしれません。

オープンソースであることから世界中のさまざまなAI技術者がノウハウを詰め込み、学習データを提供することで、Big Tech企業製AIより高度になる可能性もあります。


■ローコスト×OSS「FlexGen」で使えるAIに

ChatGPTは確かに衝撃を与えましたが、お試し期間を終えて真っ当な料金体系で提供されるようになると一気に用途開発や利用が萎んでしまう可能性があります。

またChatGPTはもっともらしい答えを返すものの平気で噓をつく問題もあります。新しいアイディアを尋ねると非常に役立つものの、事実を確認するような質問は苦手で、人のプロフィールを尋ねると嘘の経歴を並べてしまいます。

このあたりの使えなさについては改善が必要で、ChatGPTにしろGoogleのBardにしろ研究は続けられるはずですが、広く皆に使われてこそ改善される部分が多いはずです。

「FlexGen」は現実的な費用感で、データ秘匿が必要な用途にもローカル環境・自社専用環境も作れる。OSSによっていろんな視点で開発が進められる。

つまりジェネレーティブAIが本当に一般普及させるゲームチェンジャーになるのは「FlexGen」かもしれない、というのが本記事の主張まとめです。

ChatGPTが覇権を握るのか、「FlexGen」が勝つのか、GoogleやAppleはどう対抗するのか、いずれにせよジェネレーティブAIの普及は間違いありません。

この記事が気に入ったらサポートをしてみませんか?