見出し画像

GPT-4の革命 | 全ビジネスに変革をもたらす驚異のマルチモーダルAI

OpenAIの大規模言語モデル「GPT」の第4世代である「GPT-4」が発表された。

これがとにかくスゴい。もはや業種を問わずGPT-4を抜きに今後のビジネスは語れないレベルに到達したと言える。
このnoteではいまだに興奮冷めやらぬGPT-4の凄さを紹介していく。

注目すべきGPT-4の3つの進化


GPT-4への進化で注目すべきは「マルチモーダル」「処理能力の大幅な向上」「安全性の向上」の3つだ。

1. マルチモーダル

GPT-4の大きな特徴はテキストだけではなく画像も組み合わせたインプットや処理ができることである。

例えば以下デモのように、手書きのウェブのスケッチを中身のジョークをちゃんと書き直しつつHTML/CSS/JSのコードを書き出して完全に機能するウェブサイトを生成することが可能だ。

また、GPT-4はテスト用紙の写真から問題を解いたり、ミーム画像のどこが面白いのかの解説をするなど、GPT-4はテキストと画像という複数のメディアを組み合わせた処理が可能になっており、今までのテキスト中心のAIとは一線を画すアップデートになっている。


2. 処理能力の大幅な向上

GPT-4になってシンプルに処理能力も大幅に向上している。

以下のデモでは税金の複雑かつ長大なドキュメントを貼り付けて、自分の家族の控除金額や税金を計算してくれている。

また、既存の医薬品の情報を送ると、類似した性質を持つ化合物を見つけ、特許侵害しないように修正し、購入可能なサプライヤーへの注文メールも作成するというにわかには信じがたい処理能力の高さを見せている。

3. 安全性の向上

また、GPT-4は不適切な質問に対しても適切な対応ができるようになっており、安全性が大幅に向上している。武器の作り方や不健康につながる質問など不適切な質問をされた際に、GPT-4では質問者が悪い方向に進まないように工夫して返答するようになっている。


GPT-4を活用したサービス


このように高機能なGPT-4はすでにAPIが一般にも公開されているが、それに先立っていくつかのパートナー企業には先行的に提供されており、GPT-4を活用した様々なサービスがすでに登場している。

マイクロソフトからはGPT-4を搭載したCopilot for Microsoft 365が発表されており、Wordでの文書作成、Powerpointでのスライド作成、Excelでのデータ分析、Teamsで議事録作成など多くの人が日常的に使っているサービスにGPT-4がコア機能として搭載される。

また、グローバルで広く使われているカスタマーサポートSaaSのIntercomがGPT4を組み込んだカスタマーチャット機能をリリースしたり、

盲目の方向けのアシスタントサービスを開発するBeMyEyesは、画像も理解できるGPT-4を活用して、目の前の景色をAIが読み取って目が見えない方の服選びや買い物や注文などをサポートするサービスを発表している。

この他にも様々な企業がサービスすでにGPT-4を活用したサービスや新機能を続々発表している。

https://openai.com/product/gpt-4


GPT-4を活用したアプリケーションレイヤーの取り組みは全企業が取り組むべきテーマ


以下のチャートが示すように、GPT-4では日本語の性能も大幅に向上している(GPT3.5を英語で使うよりもGPT4を日本語で使う方がはるかに精度が高い)。

大規模言語モデルやその他生成AIのモデル自体をつくる戦いは大幅に後手に回ってしまっている日本だが、そうしたモデルを活用するアプリケーションレイヤーはまだまだチャンスが広がっている。

実際欧米企業は軒並みそうなのだが、ここまで進化したGPTをいかに自社の事業・サービスに活かすか、どう新しいサービスを生み出すかについて、既存の戦略やプロダクトロードマップを0から見直して考えるべき状況になっている。

自分自身もこのレイヤーで価値あるサービスをつくるべく準備を進めており、また多少なりとも生成AIに詳しい身として様々な企業への顧問・コンサルティングを通して日本がこのテクノロジーに大波にしっかり乗るためのサポートをしています。

こうした生成AI領域のコンサルに興味がある企業の方はお気軽にTwitterなどでご連絡頂けますと幸いです。


AIやXRなどの先端テック、プロダクト戦略などについてのトレンド解説や考察をTwitterで日々発信しています。 👉 https://twitter.com/kajikent