![見出し画像](https://assets.st-note.com/production/uploads/images/100801252/rectangle_large_type_2_8d2fe907143bb953f8ab0de9b2c71cb7.png?width=800)
GPT-4の革命 | 全ビジネスに変革をもたらす驚異のマルチモーダルAI
OpenAIの大規模言語モデル「GPT」の第4世代である「GPT-4」が発表された。
これがとにかくスゴい。もはや業種を問わずGPT-4を抜きに今後のビジネスは語れないレベルに到達したと言える。
このnoteではいまだに興奮冷めやらぬGPT-4の凄さを紹介していく。
注目すべきGPT-4の3つの進化
GPT-4への進化で注目すべきは「マルチモーダル」「処理能力の大幅な向上」「安全性の向上」の3つだ。
1. マルチモーダル
GPT-4の大きな特徴はテキストだけではなく画像も組み合わせたインプットや処理ができることである。
例えば以下デモのように、手書きのウェブのスケッチを中身のジョークをちゃんと書き直しつつHTML/CSS/JSのコードを書き出して完全に機能するウェブサイトを生成することが可能だ。
GPT4の発表の中で分かりやすく凄かったのは、手書きのウェブのスケッチを中身のジョークをちゃんと書き直しつつHTML/CSS/JSのコードを書き出して完全に機能するウェブサイトを生成してみせた点。
— KAJI | 梶谷健人 (@kajikent) March 15, 2023
そのうちノーコードツールというジャンルは消えて全部生成AIでできちゃいそう。 pic.twitter.com/BjKZ6aDWRX
また、GPT-4はテスト用紙の写真から問題を解いたり、ミーム画像のどこが面白いのかの解説をするなど、GPT-4はテキストと画像という複数のメディアを組み合わせた処理が可能になっており、今までのテキスト中心のAIとは一線を画すアップデートになっている。
GPT4は宿題やテストの用紙を写真撮って投げるとステップバイステップで解いてくれるらしく、これが自分が学生時代にあったら間違いなく勉強しなくなってた笑 pic.twitter.com/8xux8jjEt8
— KAJI | 梶谷健人 (@kajikent) March 15, 2023
GPT4、ミーム画像の解説までしてくれる。
— KAJI | 梶谷健人 (@kajikent) March 15, 2023
AIからお笑いについて教えてもらう時代がこんなに早くくるとは誰が想像しただろうか。 pic.twitter.com/ZzLuM4sImu
2. 処理能力の大幅な向上
GPT-4になってシンプルに処理能力も大幅に向上している。
以下のデモでは税金の複雑かつ長大なドキュメントを貼り付けて、自分の家族の控除金額や税金を計算してくれている。
GPT4のライブデモでめっちゃ良いなと思ったのは、税金の複雑かつ長大なドキュメントを貼り付けて、自分の家族の控除金額や税金を計算してもらってたデモ。
— KAJI | 梶谷健人 (@kajikent) March 15, 2023
これは全人類が欲してるやつ!笑 pic.twitter.com/ta0iq1IRBZ
また、既存の医薬品の情報を送ると、類似した性質を持つ化合物を見つけ、特許侵害しないように修正し、購入可能なサプライヤーへの注文メールも作成するというにわかには信じがたい処理能力の高さを見せている。
GPT4の論文を読んでたら、GPT4が新薬の開発までやってて腰抜かした。
— KAJI | 梶谷健人 (@kajikent) March 16, 2023
既存の医薬品の情報を送ると、類似した性質を持つ化合物を見つけ、特許侵害しないように修正し 、購入可能なサプライヤーへの注文メールも作成する。
いろいろAIの進化見てきたけど、これが一番シンギュラリティを感じる。 pic.twitter.com/dnAsJBdrOQ
3. 安全性の向上
また、GPT-4は不適切な質問に対しても適切な対応ができるようになっており、安全性が大幅に向上している。武器の作り方や不健康につながる質問など不適切な質問をされた際に、GPT-4では質問者が悪い方向に進まないように工夫して返答するようになっている。
![](https://assets.st-note.com/img/1679362643024-xFcB4QVZH7.png?width=800)
GPT-4を活用したサービス
このように高機能なGPT-4はすでにAPIが一般にも公開されているが、それに先立っていくつかのパートナー企業には先行的に提供されており、GPT-4を活用した様々なサービスがすでに登場している。
マイクロソフトからはGPT-4を搭載したCopilot for Microsoft 365が発表されており、Wordでの文書作成、Powerpointでのスライド作成、Excelでのデータ分析、Teamsで議事録作成など多くの人が日常的に使っているサービスにGPT-4がコア機能として搭載される。
また、グローバルで広く使われているカスタマーサポートSaaSのIntercomがGPT4を組み込んだカスタマーチャット機能をリリースしたり、
グローバルでめちゃくちゃ使われてるカスタマーサポートSaaSのIntercomがGPT4を組み込んだカスタマーチャット機能をリリース。
— KAJI | 梶谷健人 (@kajikent) March 16, 2023
GPTをうまく統合できないカスタマーサポートチャットボットの企業はこれから一瞬で駆逐されるだろうな。 pic.twitter.com/Tb8tKjo4Mt
盲目の方向けのアシスタントサービスを開発するBeMyEyesは、画像も理解できるGPT-4を活用して、目の前の景色をAIが読み取って目が見えない方の服選びや買い物や注文などをサポートするサービスを発表している。
GPT4を搭載した盲目の方向けのアシスタントサービスを @BeMyEyes が発表。
— KAJI | 梶谷健人 (@kajikent) March 16, 2023
GPT4は画像も理解できるので目の前の景色をAIが読み取って目が見えない方の服選びや買い物や注文などをサポート。
途中使っている人が涙ぐむシーンもあるが、AIは人類の良きパートナーであることが良く分かる良い例。 pic.twitter.com/NFOgQ6eGqJ
この他にも様々な企業がサービスすでにGPT-4を活用したサービスや新機能を続々発表している。
![](https://assets.st-note.com/img/1679363422253-qhji4v1NQw.png?width=800)
GPT-4を活用したアプリケーションレイヤーの取り組みは全企業が取り組むべきテーマ
以下のチャートが示すように、GPT-4では日本語の性能も大幅に向上している(GPT3.5を英語で使うよりもGPT4を日本語で使う方がはるかに精度が高い)。
![](https://assets.st-note.com/img/1679363497860-5LgAaY2171.png?width=800)
大規模言語モデルやその他生成AIのモデル自体をつくる戦いは大幅に後手に回ってしまっている日本だが、そうしたモデルを活用するアプリケーションレイヤーはまだまだチャンスが広がっている。
実際欧米企業は軒並みそうなのだが、ここまで進化したGPTをいかに自社の事業・サービスに活かすか、どう新しいサービスを生み出すかについて、既存の戦略やプロダクトロードマップを0から見直して考えるべき状況になっている。
![](https://assets.st-note.com/img/1679364005133-zax9Abr5S6.png?width=800)
自分自身もこのレイヤーで価値あるサービスをつくるべく準備を進めており、また多少なりとも生成AIに詳しい身として様々な企業への顧問・コンサルティングを通して日本がこのテクノロジーに大波にしっかり乗るためのサポートをしています。
こうした生成AI領域のコンサルに興味がある企業の方はお気軽にTwitterなどでご連絡頂けますと幸いです。
AIやXRなどの先端テック、プロダクト戦略などについてのトレンド解説や考察をTwitterで日々発信しています。 👉 https://twitter.com/kajikent