見出し画像

社内データをChatGPTで活用するための一考察(食べログ プラグインの感想)

記事を執筆するための労力:★★★★☆
記事を理解するための労力:★★★★☆

はじめに

 ChatGPTにはかなり応用可能性があることが分かってきました。検索しても分かるような質問を投げかけて回答をもらうこともChatGPTのできることの一つですが、プログラミング作成のようにスケールすることをChatGPTにさせることが究極的な目標になるでしょう。
 もし、社内データの活用をChatGPTにさせることができれば業務の様々な場面で応用できると予想しています。そうした活動の中で、経営判断のための材料を提供することも可能かもしれません。
 しかしながら、ChatGPTの特性として大規模言語データを利用しているというものがあります。これは、社内の特殊事情を考慮していないことを意味しています。そのため、単にサイトで質問するだけでは社内データを最大限活用できません。
 この記事ではいくつかの方法を検討することで、社内データの活用方法を探ります。その際に先駆者の執筆した数多の記事を引用しているので、まとめとしての価値もあるかもしれません。

前提条件

・社内でChatGPTの利用が許可されている
・社内データをChatGPTで読み込ませることが許可されている
 →データ利用の可否について基準が設けられている
・ChatGPT Plusのアカウントを保有している

・社内データを大規模言語データとして扱うことは基本的にできないです。

OpenAIのGPT-3やGPT-4(ChatGPT)は固定されたモデルであり、一度訓練が完了すると、新しいデータを用いて再訓練することはできません。つまり、モデルが参照する大規模な言語データに独自のデータを直接連結することはできません。ChatGPT APIを利用する方法が挙げられます。
 OpenAIは一部のユーザーやパートナー企業に対して、特定のタスクやデータセットに対して大規模なモデルをファインチューニングする機能を提供しています。これはモデルの一部のパラメータを調整し、特定のタスクやデータに対するパフォーマンスを改善する方法です。しかし、この機能は一般には公開されていないため、利用できるかどうかはOpenAIに直接問い合わせる必要があります。

ChatGPT4.0

GPTのサイトを用いて社内データを活用する方法

 この方法はGPTのサイトに対して、社内データを用いて質問することになります。社内データの漏洩リスクがあるため事前にオプトアウト申請をしておくことが望ましいです。(社内利用するのであれば申請しておくべきです)
 質問した結果としては、大規模言語データを用いた回答になるので一般的な話が多くなります。これには良い面も悪い面もありますが会社特有の回答が欲しい場合はもう一工夫必要です。
 例えば、分析後の社内データを用いて質問することで経営層が意思決定する際に役に立つ情報が得られるかもしれません。
 どうしても大量に質問したい場合は、OpenAIが提供するAPIを用いてプログラムから直接行うことができます。もしくは、PowerAutomateなどのRPAを用いて行うこともできるでしょう。

APIを用いて社内データを活用する方法

 APIは異なるソフトウェア間の通信を円滑にするための機能となっており、3.5のAPIはすでに開放されています。一方で、4.0のAPIはWaitingList制となっており、使いたいと思ってもすぐに使用できない状況です。(私もその中の一人です)
 社内アプリケーションやサービスに自然言語処理能力を組み込むことで、ユーザーとの対話、質問応答、文章生成、文章の要約など、様々なタスクを自動化できます。APIを利用するためには十分にITに詳しい必要があります。
 APIの柔軟さの一形態として、以下のようにExcelファイルの分析もできるようです。

Excelファイル、PDFファイルを用いて社内データを活用する方法

Excelについて

 CSVをChatGPTに分析させている人のブログです。(更新日:23/3/6)
かなり早い段階でレポートの自動作成を行っており、優秀な人間であることが伺えます。
 基幹システムの情報をCSVに成形して分析できれば、かなりいい感じの結果が得られそうです。情報をまとめたファイルをChatGPTに質問というアプローチでは統計処理の方法、処理結果、洞察まで一貫した回答が得られる可能性が高いです。

 一方で、ExcelのセルにChatGPTの回答が欲しい場合はアドインがリリースされているのでそれを利用するのがよいでしょう。

PDFについて

 AskYourPDFというプラグインを利用すればweb上にあるPDFを読むこともできるようです。その他、Show Meというプラグインも面白そうです。

 本家のサイトに行けばweb上にないPDFでもドラッグアンドドロップで利用可能なようです。

ブラウジング機能を用いて社内データを利用する方法

 ChatGPTにURLを入力することでその内容を読み込ませることができます。ChatGPTの探索範囲が外部に公開できる内容に限定されると考えられるため、社内データを利用とは趣旨が変わってくるかもしれません。したがって、社内データというよりは、競合他社のデータ分析への活用になるかもしれません。
 今後、ローカルな環境でChatGPTを構築することができれば、社内サイトをブラウジングできるかもしれません。社内情報漏洩リスク低減のために、ローカルで生成系AIの内製化に動く企業も一定数あると考えます。
 ブラウジング機能を有効化する方法については下記の記事で説明しましたが、ブラウジング機能は早期アクセスなので利用できない方は申し訳ありません。

プラグインを用いて社内データを活用する方法

 食べログのプラグインが全ての意味で参考になると思います。なぜなら、ChatGPTを用いた社内データの活用についての第一人者と捉えることができるためです。(私の記事を読むのをやめて下記の記事を読んでください)

 記事を確認するにかなりタフな仕事です。もし、あなたが職場の上司にChatGPTで社内データを分析や活用を命じられたのならば、初めにこの記事を見せて脅すべきかもしれません。(上司はどこまでの社内調整をしてくれますか?)
 大枠で捉えるとプラグインがやっていることは、①ChatGPTからのお店検索リクエスト受付、②回答生成に必要なお店の情報をChatGPTに返却というものです。お店検索リクエスト作成のときは、食べログで検索するような情報(フリーワード、日時、予約人数)をユーザーの入力に従ってChatGPTが生成する仕組みになっているようです。
 記事によるとChatGPTの回答を改善する方法の一つとしてPlugin manifestのdescription_for_modelに説明を記載ことが挙げられています。従来であれば人工言語によるプログラミングだったものが、ChatGPTでは一部自然言語による指示になっています。

 期待の動きは「1つのお店につき1つのリッチプレビューを表示する」ことなので、下記の説明を追加しました。
Rich previews should be output only once per restaurant.

日本初の挑戦〜食べログによるChatGPTプラグイン開発の舞台裏

 ここまでできればChatGPTとの戦いには完全勝利したといってよいでしょう。

オープンソースを用いて社内データを活用する方法

 冒頭でも述べたように、基本的には学習対象として社内データを用いるということは不可能です。しかしながら、ChatGPTを再構築できるのであれば社内データを学習対象としたツールを作成することは理論上可能だと思います。

 記事の信憑性に疑問はありますが、OpenAIのChatGPTもオープンソースとして利用できるようになるかもしれません。

 5月16日のThe Informationの報道によると、2月にMetaから漏洩したものなど競合するオープンソースのAIモデルからの圧力が高まる中、OpenAIはこの動きに着手している

ChatGPT開発元のOpenAI、オープンソースのAIモデル公開を準備中=報道

 オープンソースを活用できるのであれば、情報漏洩のリスクを下げつつ大規模言語データと社内データの結合や置き換えができるかもしれません。
 ただし、この予測は高度IT人材が社内に存在するという強烈な前提に基づいています。

おわりに

 具体的な方法としては、既存のサイトの利用、APIの利用、プラグインの作成、オープンソースの利用等ということが分かりました。ひょっとするとすでに社内データ活用のためのプラグインが存在しているかもしれません。
 また、日系大企業でChatGPTを利用して社内データを分析するのは個人の力では不可能に近いという印象を受けました。実現するためには、少なくとも課や部レベルで意識が合っていないと難しそうです。
 一方で、個人事業主や社内調整が簡単な中小、ベンチャー企業は上手く活用することができるかもしれません。冒頭でも述べた通り、ChatGPTを利用して事業をスケールできれば社員の数などは些細な事柄となるでしょう。

この記事が気に入ったらサポートをしてみませんか?