GPTのドミノ倒しはどこまで広がるか?
GPTを中心に大規模言語モデル(LLM)を活用した生成AIの勢いが止まりません。
わずか1週間で100万人、2か月で1億人(記録で言えばそれまでがTiktokで9か月!)のユーザ獲得という破竹の勢いです。
しかも第4世代とAPI提供、Pluginサポート開始など、一気に勝負にかけているのが見て取れます。(最大出資元であるMicrosoftの影響が大きいのかなと思います)
下記のサイトで3月18日時点での利用に関するまとめのサイトがあったので紹介します。
以前にも触れた通り、競合も黙っているわけではなく対抗馬をリリースまたは準備に取り掛かっています。
あくまで投稿時点ですが(この数か月でだいぶ動きが激しいと思います)、他のGAFAMの動きを1文で添えておきます。
Amazon:対抗馬のHugging Faceを応援
Facebook(現Meta):自社独自のLLM「LLaMA」をリリース
Apple:Siri開発を見直し(一部自社デバイスアプリでChatGPT利用制限)
ただ、上記のまとめにあるとおり、下記の国でセキュリティ上の理由からChatGPTの利用が制限されています。
中国
ロシア
ウクライナ
アフガニスタン
イラン
ベラルーシ
ベネズエラ
この中でも人口で際立つのが10億人超の中国ですね。(改めて中国を除外してても1億人を軽く超えた勢いはすごいです)
中国では全く生成系AIと無縁かというと独自の動きを見せつつあります。
中国のGAFAMに相当するテックジャイアントBATH(バイドゥ・アリババ・テンセント・ファーウェイ)でも動きがあります。
既に上記を使ったユーザからの評価も届いてますが、いずれにせよこういった枝葉の動きをみていると翻弄されそうです。
上記は全て自然言語の生成系AIですが、元々2022年は画像生成がブームとなりました。(Stable Fusionとかですね)
なんとなく画像系がかき消せられたように見えるかもしれませんが、APIやPluginが出たことによって組み合わせたサービスも登場しています。
こういったGPTの衝撃をどう見るかですが、単に自然な対話が出来る、という単一能力ではなく、他サービス連携を開放したことによって、人体に例えると高い言語能力を獲得することによって五感能力全体が底上げされる、と言えるかなと感じます。
もう1つだけ添えると、画像生成同じく勢いがトーンダウンとしたように見える「メタバース(3次元体験)」にも影響を与え、個人的に注目しているのが下記の発表です。
Blenderとは、3次元モデル開発基盤で、Whisperとは音声認識モデルでこれもGPT同様OpenAIが開発元です。
上記の意味するところは、音声だけで3次元モデルを簡単に生成できるようになることを指します。
もう少し言えば、2022年の画像生成AIで誰でも豊かな画像を作れるようになったことが、3次元でも起こる可能性を秘めています。
メタバース(3次元体験)の中で用意された3次元コンテンツだけでなく、自由に自分の作りたいものを言葉で唱えるだけでリアルタイムに生成される世界が到来したわけです。
このように、GPTという大きなドミノが倒れたことによって、途中で止まっていた他のドミノにも活力を与え、それが思いもよらぬ分野にも広がっていきそうです。
最近改めてこの文脈でシンギュラリティという言葉をよく見かけますが、言葉の定義と解釈はともかくとして、地殻変動が起こりつつあるのは体感的に感じます。
この記事が気に入ったらサポートをしてみませんか?