[ここまで進化したChagGPT!] 今日から何がどう変わるのか [2023年11月最新版]
皆さん初めましてこんにちはこんばんは。スウェーデン在住のエンジニア、Harry(ハリー) ( https://twitter.com/harrythecode )と申します。
普段はDevOpsエンジニアとして働く傍ら、生成AIの最前線にも繰り出し、ToBやToC向けのアプリケーション開発などにフルスタックエンジニアとして携わっています。
2023年11月7日 日本時間午前3時より、ChatGPTの生みの親、OpenAI社のサム・オルトマンによる講演が行われました。
この中で、多くの人が待ち望んだ様々な機能の実装や改善が行われています。
読むのが辛いよ、って方は以下の一言まとめをどうぞ。
また今回の発表によって何が新しくなって、今後どう変わっていくのか、を現役エンジニア目線でご紹介します。では見ていきましょう。
何が新しいん?
GPT-4 Turboの発表:
コンテキスト長の拡張: 128,000トークンまで対応可能に。
対数確率の表示: APIを通じて対数確率を確認できるようになる機能を提供。
世界知識の向上: 外部のドキュメントやデータベースからの情報を取り入れることができる「retrieval」機能(通用RAG)をプラットフォームに追加。
カスタムモデル: 特定の企業や用途に特化したカスタムモデルを作成するためのサポートを提供。
音声とビジョンの機能:
音声生成: テキストから自然に聞こえるオーディオを生成することができ、APIで6つのプリセットボイスから選択することが可能。
価格の削減: GPT-4 Turboは改善されたモデルでありながら、GPT-4の半額近い価格帯に。
GPTsの導入:
自分だけのGPTエージェントが作れちゃう: プロンプトやドキュメントをアップロードすることでカスタムAIを作成でき、これはプライベート、会社、または公開設定で利用可能。
開発者向けの改善:
サンドボックス環境: 安全なテストとプロトタイピングのためのサンドボックス環境が提供される。
機能呼び出しの改善: デベロッパーがアプリケーション内でより効率的にAIアシスタントと対話できるように機能呼び出し機能が改善された。
GPT Storeの立ち上げ:
人々が自分のGPTを作成し、他の人が使用できるように公開するためのGPT Storeが紹介された。
収益分配: 最も有用でよく使われるGPTを作成した人々には、OpenAIの収益の一部が支払われる。
デモンストレーション:
チャットアプリのデモでは、ユーザーのメッセージをスレッドに追加し、AIアシスタントがリアルタイムで返答を行う様子が示されました。
音声認識アプリのデモでは、音声入力をリアルタイムでテキストに変換し、そのテキストを使用してAIアシスタントが返答する様子が示された。
上記の他にもDalle-3, GPT-4V, リアルタイム音声読み上げのWhisper v3の紹介などがありました。
で、結局何が起きるん?
ボクの目からは大きく以下の3つの変化が起こると考えてます。
GPTsによる、社内専用GPTの開発加速 / GPTボットインフルエンサーの増加
Dalle-3/GPT-4VのAPI公開による、写真を読み込んで色々解析する系の案件増加
プロンプトエンジニアリングの需要が高まる
では順に見ていきます。
GPTsによる、社内専用GPTの開発加速 / GPTボットインフルエンサーの増加
「GPTs」を一言で言うと、自分の持っている各種ファイルをGPTに覚えさせて、それをもとにAIに回答してもらう、と言うものです。
要はノウハウをより簡単に、個人、会社、全世界の3つのレベルで共有することが可能になります。
社内のナレッジデータベースとAIを繋いでチャットボットができちゃうんですから驚きです。
これが「プログラミング知識なし」で作れると言うから更に驚きです。また、GPTボットを全世界に公開して、それの収益をシェアすると言うモデルも追加されるためGPTボットインフルエンサーが増えることが予想されます。
Dalle-3/GPT-4VのAPI公開による、写真を読み込んで色々解析する系の案件増加
今までChatGPTは文字だけしか取り扱うことができなかったのですが、今後は「目」と「声」を手に入れました。
これの活用道としては、例えばアナログで図面を読んで色々やってた作業をAIに任せたり、だとかデザイナーに頼んで画像とかグッズとかそう言うのを頼んでたけど自分で簡単に作れるアプリケーションの開発だとか、これはどちらかと言うと開発者にとって嬉しい機能ですね。
この手の案件も水面下では多く発生することでしょう。
プロンプトエンジニアリングの需要が高まる
ChatGPTを使ってみて多くの人がぶち当たる壁が「こいつ言うこと全然聞かないぞ」問題です。これはトークン数が増えれば増えるほど、より顕著になっていきます。
要はたくさんのことを覚えることができると言っても、その中からあなたが求めている答えを探し出すためには「新人に仕事を教えるのと同様に1から10まで細かな指示を出す」必要があります。
これを広く一般には「プロンプトエンジニアリング」と呼ばれています。こちらの専門スキルを持った人がより需要が高まっていき、AI人材の確保に色んな会社が追われることになっていきます。
最後に
いかがでしたでしょうか。今回の発表は今後大きな流れを作っていくような、重要な機能の発表であったりもします。
ただChatGPTが表に出てから開発を続けてる身として思うのは「どんなに黄金を掘り出せるツール」を手に入れたからとして、その使い方を知らないとかなり損する、と言うことです。
AIが発展しても、それを使いやすくするためのノウハウは実践の中でしか生まれません。
「AIを使って新しいことを始めたい」だったり「こんなこと、あんなことができないかな」と気になる方はぜひお気軽にDMください :)
この記事が気に入ったらサポートをしてみませんか?