![見出し画像](https://assets.st-note.com/production/uploads/images/123642344/rectangle_large_type_2_36600495de0fadb3baaf28da44d223c2.png?width=1200)
【OpenAI DevDay】ChatGPTはどこまで進化した?アップデート内容を改めて整理してみる
皆さまこんにちは。2020年に新卒として株式会社コンピュータマネジメントに入社し、Webマーケティングを担当している入社4年目のMです。
今からおよそ1ヵ月前の日本時間2023年11月7日未明、ChatGPTをこの世に生み出した米OpenAI社が、開発者向け初のカンファレンスとなる「OpenAI DevDay」をサンフランシスコにて開催しました。
そこでは、ChatGPT関連サービスの大幅なアップデートや新機能が多数紹介され、「すべての内容が革命的」「想像していた以上に衝撃的な内容」と、世界中でかなり大きな注目を集めました。
「OpenAI DevDay」で披露されたChatGPTの革新的なアップデート内容に感動する人が多い一方で、
「内容が盛りだくさんすぎて情報を追いきれない・・・」
「結局何が新しくなったのかよく分からない・・・」
と思っている方もきっと少なからずいらっしゃるのではないでしょうか?(かく言う私もその1人・・・)
そこで今回は、「OpenAI DevDay」で発表されたChatGPTのアップデート内容について、「一般ユーザー向け」と「開発者向け」の大きく2つに大別して、簡単に分かりやすく解説していきたいと思います!
一般ユーザー向け
最初に、ChatGPT Plus(有料版/月額20ドル)ユーザー向けのアップデート内容をご紹介します。
(※無料版ユーザー向けのアップデートは無し)
2023年4月までの知識を持つようになった
GPT-4の進化版である新たなモデル「GPT-4 Turbo」が発表され、2023年4月までのデータに基づいて回答できるようになりました。
通常のGPT-4でも、既に2023年4月までの知識がインプットされているとのことです。
ちなみに、無料版のGPT-3.5も密かにアップデートされていたようで、今や2022年1月までのデータを学習しています。
以前は2021年9月までのデータだったのに、いつの間に・・・!
![](https://assets.st-note.com/img/1701663623680-fPMossLgEy.png?width=1200)
ChatGPTの全機能を同時に使用できるようになった
これまでは、AIによる画像生成を行いたい場合は「DALL・E3」を選択し、インターネット検索を行いたい場合は「Browse with Bing」を選択する・・・といったように、ChatGPTの追加機能を使う際は毎回タブを切り替える必要がありました。
しかし、今回のアップデートにより、「GPT4 All Tools」という機能が追加され、1つのチャット内で画像生成機能やインターネット検索機能などをすべて併用できるようになりました。
これで、例えば、
今日の東京の天気を調べ、それに基づいて東京の写真を作ってください。
とChatGPTにお願いすれば、今日の天気情報をWeb検索した結果と、得られた天気情報に基づいて生成された画像が、同時に回答として返ってくるようになります。
自分専用のカスタムChatGPTを作れるようになった
一般ユーザー向けのアップデート内容としては、これがいちばん革新的と言っても良いでしょう。
なんと、ユーザー自身がChatGPTを自分好みにカスタマイズして、特定の用途・目的に特化したオリジナルChatGPTを作れるようになったのです!
こうしたカスタムChatGPTは「GPTs」と呼ばれ、ノーコードで誰でも簡単に作成できます。
当社でも、とある社員が「ブログサムネイル作成GPTs」を試しに作ったところ、次のような画像が生成されたとのこと。意外とクオリティ高くてビックリしました。
![](https://assets.st-note.com/img/1701669105438-ifmClVEYjW.png?width=1200)
【入力したもの】
・キャッチキーワード:
情シスのアウトソーシングを依頼して、もっと身軽に!
・ブログタイトル:
アウトソーシングを活用して情シス業務をもっと身軽に!メリット・デメリットや選定ポイントは?
・テイスト:
楽しくハッピー。いらすとや風。
また、自分が作成したオリジナルの「GPTs」を一般公開したり、他ユーザーが作成した「GPTs」を探して利用したりできる「GPT Store」が、2024年初頭にサービス開始となるようです。
当初は12月に開始予定でしたが、「予期せぬ出来事で忙しくなった」として、来年に延期されたようです。(サム・アルトマン氏のCEO解任騒動が関係しているとのこと・・・)
「GPT Store」では、自分の作ったGPTsで収益化が可能になるとも言われており、今後の動向にますます目が離せません。
開発者向け
続いて、エンジニアなど開発者向けのアップデート内容をご紹介します。
より安価で長文に対応するようになった
GPT-4 Turboでは、従来のGPT-4のおよそ16倍にあたる「128K」ものトークン数を扱えるようになり、実に300ページ相当のテキストを1つのプロンプトに入れられるようになりました。
本1冊分の長文をまるっと読み込ませられるようになった点はかなりの進化ですね・・・!
一方で、価格面においても大きな改善が見られており、入力トークンは従来と比べて3倍、出力トークンは2倍安価になったことから、これまでにない低コストで効率良く最先端のAI技術を活用できるようになりました。
![](https://assets.st-note.com/img/1701670745430-nStAX9EZUr.png?width=1200)
1つのプロンプトで複数の行動を実現できるようになった
アプリや外部APIの機能をモデルに説明することで、その機能を呼び出すことができる「Function Calling」がアップデートされ、1つのメッセージで複数の関数を呼び出せるようになりました。
![](https://assets.st-note.com/img/1701673334648-4HVa4BPyHM.png?width=1200)
従来は、一度につき1つの関数しか呼び出せませんでしたが、今回のアップデートにより、「車の窓を開けて、エアコンを切って」のように、複数のアクションが必要な場合でも一発で要求できるようになりました。呼び出しの精度も上がったようです。
出力結果をよりコントロールしやすくなった
今回のアップデートにより、「CSV形式で出力してください」といったように、形式を指定して出力する場合の精度が大きく向上しました。
また、新しく「JSONモード」が実装され、正しいJSON形式での応答が保証されるようになりました。
新しいパラメータ「response_format」でtype: "json_object"を指定すると、必ずJSON形式で出力されるようになります。
これで出力形式の「ブレ」によるエラーの数が減り、開発やテストの手間を省けるようになることが期待できます。
出力再現性を確保できるようになった
これまでは、GPT-4から出力される結果は完全にランダムであり、同じプロンプトを入力したところで、必ずしも同一の回答が返ってくるとは限りませんでした。
しかし、APIの呼び出し時に新たなパラメータ「seed」で同一の値を指定することで、再現性のある出力が保証されるようになりました。
自分だけのAIアシスタントを作成できるようになった
開発者が自分のアプリケーション内でAIアシスタントを構築できるようにした新しいAPI「Assistants API」が発表されました。
特定のタスク/指示を与えるだけで、その実現に向けた行動計画をAIが自律的に考えて実行してくれる「エージェント」のような機能を備えており、これまで開発者が自ら組み立てる必要があった多くの複雑な処理を簡単に実装し、より高品質なAIアプリの構築が行えるようになりました。
「Assistants API」の特徴は大きく2つあります。
スレッドの長さが無制限になり、過去のチャット会話履歴を永続的に保持しておけるようになった
「Code Interpreter」「Retrieval」「Function calling」という3つの機能を自由に呼び出せるようになった
・Code Interpreter(コードインタープリター):
Pythonコードを書いて実行し、グラフやチャートといった図表を出力できる機能
・Retrieval(情報検索):
外部からさまざまなデータファイルを読み込み、AI側で処理できるようにする機能
・Function Calling(関数呼び出し):
プロンプトで指定した任意の関数を呼び出し、その実行結果をユーザーに返す機能
画像認識・画像生成・音声読み上げのAPIが使えるようになった
今回の発表で、次の3つのモデルがAPIとして利用可能となり、自社サービスのアプリへ自由に組み込めるようになりました。
・画像認識API(GPT-4 Turbo with vision):
┗「画像を読み込める」API。画像内の文章や手描き文字などの内容を解析できる。画像のサイズによって料金が変動する。
・画像生成API(DALL・E3):
┗「画像をゼロベースから生成できる」API。プロンプトを入力すると、その指示に応じた画像を生成できる。
・音声出力API(Text to speech/TTS):
┗「テキストの内容を自然な音声で読み上げることができる」API。6種類の声が用意されている。
著作権保護に向けた取り組みが強化された
ユーザーが著作権侵害に関する法的な問題に直面した場合、OpenAIが介入して発生した費用を負担する「Copyright Shield(著作権シールド)」サービスも発表されました。
ただし、「Copyright Shield」の適用は、開発者と「ChatGPT Enterprise」プランを利用している企業ユーザーに限定されるようです。
無料版や「ChatGPT Plus」(有料版)ユーザーには適用されないということですね。
まとめ
今回は、日本時間2023年11月7日にサンフランシスコで開催されたカンファレンス「OpenAI DevDay」にて発表されたChatGPTのアップデート内容について、なるべくコンパクトにご紹介しました。
新しくリリースされた「GPT-4 Turbo」を実際に試してみたというSE職の社員も、「これはかなり便利になった」と喜びの声を上げていました。
いよいよ課金しないと時代に取り残されそうな予感・・・。
それでは今回はこの辺で。
ここまで読んでいただき、ありがとうございました!
この記事が参加している募集
この記事が気に入ったらサポートをしてみませんか?