ChatGPT進化!GPTsでAPI連携、シームレスなAPI連携でユーザー体験向上
OpenAI Developers公式はAPIを使ったGPTsの作れるカスタム アクション機能を発表しました。これにより、同等のAPI組み込みサービスだったChatGPTのプラグインβ版を4月 9日に終了する事を告知しました。
上記の公式アカウントのポスト添付のリンク先で、GPT制作時にAPIを呼び出す方法を説明しています。
ChatGPTプラグインとは
OpenAI Developersのポストによると、プラグインのベータ版が終了し、今後はGPTをカスタマイズする方法としてGPTsが推奨されるようになります。プラグイン機能は、外部APIを呼び出してChatGPT内で直接サービスを利用できるようにするためのもで、ユーザーはOpenAIのAPIを使って自社サービスをChatGPTに組み込むことができます。
プラグインは、外部APIを呼び出してChatGPTに統合することで、さまざまなサービスを提供する機能を持っています。ユーザーは天気の情報を得たり、予約システムにアクセスしたりすることができるわけです。
ChatGPTプラグインからGPTsへ
今後は、GPTsにカスタムアクション機能を利用することによって、開発者はOpenAIのAPIを使用して自社サービスを提供できるようになります。これは、GPTを利用して特定の機能をカスタマイズし、独自のアプリケーションやサービスを作成できることを意味します。つまり、GPTsのフレームワーク内で直接カスタムアクションを組み込むことで、よりシームレスにユーザーにサービスを提供できるようになります。
プラグインからカスタムアクション機能への移行は、ユーザーエクスペリエンスの向上を目的としています。
カスタム アクションを使用して GPT を構築する方法
公式ページの内容を日本語で解説していきます。
GPTとは何ですか?
GPT (注01)は、カスタム機能とともに特定のユースケースに合わせて ChatGPT を詳細にカスタマイズする機能を提供します。次のような GPT を作成できます。
GPT がユーザーと対話する方法を決定するカスタム命令があります
ブラウジング、DALL・E、コードインタープリターなどのツールが含まれています
新規ユーザーと復帰ユーザー向けにプリセットされたスターター プロンプトが付属しています
GPT を API に接続できるカスタム アクションがあります。
※注01:詳しくは下記のNoteで説明していますので合わせてご覧ください。
GPT のアクションとは何ですか?
組み込み機能 (ブラウジング、DALL·E、コード インタープリター) を使用することに加えて、1 つ以上の API (注02)を GPT で利用できるようにすることでカスタム アクションを定義することもできます。アクションにより、GPT は API を介して外部データを統合したり、GPT をデータベースに接続したり、電子メールにプラグインしたり、ショッピング アシスタントにしたりするなど、現実世界と対話できるようになります。
アクションの設計はプラグインのベータ版からの洞察に基づいて構築されており、開発者はモデルと API の呼び出し方法をより詳細に制御できるようになります。アクションは、API を記述するための標準であるOpenAPI を使用して定義されます。
※注02:ChatGPTやDALL-E3などOpenAIモデルのAPIの使用方法は公式の導入方法ページをご覧ください。
OpenAI は、さまざまな機能と価格帯を備えたさまざまなモデルのAPIを用意しています。
GPT アクションの流れ
アクションを含む GPT を構築するには、エンドツーエンドのフローを理解することが重要です。
ChatGPT UI で GPT を作成する
手動で構成するか、GPT ビルダーを使用して GPT を作成します。
使用する API を特定します。
GPTエディター「構成」タブに移動、「新しいアクションの作成」を選択
アクションの認証スキーマの選択、スキーマ自体の入力、プライバシー ポリシー URL の設定の 3 つの主要なオプションが表示されます。
スキーマは OpenAPI 仕様形式 (OpenAI と混同しないでください) に従って、GPT が外部 API にアクセスする方法を定義します。
スキーマ、認証、プライバシー ポリシーの詳細を入力
認証方法を選択する場合、「なし」、「API キー」、「OAuth」の 3 つのオプションがあります。これらについては後ほど詳しく説明します。
スキーマについては、API 用の既存の OpenAPI 仕様を使用することも、新しい仕様を作成することもできます。OpenAPI 仕様をすでにオンラインで公開している場合は、[URL からインポート] ボタンを使用してそれをインポートできます。
ユーザーが GPT を開いて、GPT の名前を表示する左上隅のドロップダウンを選択すると、プライバシー ポリシーの URL が表示されます。
GPT の可視性を決定する
デフォルトでは、GPT は誰でもアクセスできるわけではありません
GPT を保存するときに、特定の対象者 (「自分のみ」、「リンクを知っている人」、または「全員」) に「公開」するオプションが表示されます。
これらの表示オプションにはそれぞれ、異なる制約と要件があります。たとえば、GPT を他の人と共有する場合、GPT の名前付けにはさらに制限がかかります。
ユーザーが GPT に関与する
GPT の可視性に応じて、ユーザーは共有リンク経由で GPT を試したり、GPT ストアで見つけたりする可能性があります。
OAuth が必要な場合、ユーザーはセッション中にログインするよう求められます。
GPT はバックグラウンドで、GPT の構成方法に関する情報 (利用可能なアクション、ツール、指示など) をモデルのコンテキストに挿入します。
ユーザーがリクエストを行うたびに、モデルは利用可能なツール、アクション、指示を確認し、GPT がリクエストにどのように応答するかを決定します。
ユーザー リクエストが特定の場所の天気を確認することであり、「天気を確認」アクションを利用可能にした場合、モデルは指定された OpenAPI 仕様に従ってその API にリクエストを送信し、ユーザーに応答を返します。
次のステップ
GPT の仕組みとアクションをどこで使用できるかの基本を理解したので、次のことを行うことができます。
アクションを含む GPTの構築を開始する
GPT ビルダー自体をアクションを備えたカスタム GPT としてどのように構築したかを学びましょう
GPT ポリシーをよく理解する
GPT データ プライバシー FAQ を確認しする
GPTに関する一般的な質問への回答を見つける
GPTsでのAPI連携やカスタムアクション機能の導入により、外部サービスとの連携がよりシームレスになるものの、それぞれのサービスの料金体系や利用制限については、サービス提供者側の方針に依存します。
プラグインと同様、GPTsを通じて利用できる外部APIやサービスには、無料で提供されるものもあれば、一定の利用限度を超えた場合に料金が発生するものもああります。サービスによっては、基本的な機能は無料で利用できても、より高度な機能や大量のデータアクセスを必要とする場合には、課金が必要になることがありますので注意が必要です。
この記事が気に入ったらサポートをしてみませんか?