見出し画像

ChatGPTの「Code Interpreter」はかなり使える!

ChatGPTに新機能「Code Interpreter」が追加されました。
この機能により、従来はテキスト入力しかできなかったところ、ファイル(CSVやExcel、PDFなど)のアップロードができるようになりました。
単にファイルがアップロードできるだけなく、アップロードしたファイルに対して色々な指示を出すことができます。

Webブラウジング機能が停止されてしまい、ちょっと残念に思っていたのですが、「Code Interpreter」があればChatGPTの活用の幅が大きく広がります。
ということで、早速こんな感じで使ってみました。


件数を数えるのがこんなに簡単に!

読み込ませるファイルは「事業再構築補助金第9回の採択結果」のExcelとします。
PDFはうまく読み込めなかったので、Excelとしています。
こちらにある公に公開されているものです。

採択結果が出た際、認定支援機関ごとにどれくらい採択されているのか比較することがあります。
これまではExcel内で関数を使ってやっていましたが、ChatGPTを使えばあっという間に出力してくれます。

(プロンプト)
「認定支援機関名」をカウントしてください。上位20位の名前と件数を出力してください。

実行後、ファイルを読み込み、処理をするpythonのコードをChatGPTが自動で作り、結果を出力してくれます。

(出力結果)
「認定支援機関名」の上位20位の名前と件数は以下の通りです:

1. ゼロス税理士法人: 68件
2. 京都信用金庫: 57件
3. 株式会社フラッグシップ経営: 53件
4. 株式会社京都銀行: 46件
5. 北浜グローバル経営株式会社: 45件
6. 株式会社静岡銀行: 40件
7. 京都中央信用金庫: 36件
8. 株式会社池田泉州銀行: 34件
9. 株式会社エフアンドエム: 30件
10. 株式会社八十二銀行: 29件
11. 株式会社コムラッドファームジャパン: 26件
12. 株式会社常陽銀行: 25件
13. 株式会社滋賀銀行: 25件
14. 大阪信用金庫: 24件
15. 株式会社千葉銀行: 23件
16. 株式会社北陸銀行: 23件
17. 株式会社名古屋銀行: 23件
18. 東京商工会議所: 23件
19. 坪井 亮: 23件
20. 株式会社関西みらい銀行: 22件

これらが「認定支援機関名」の上位20位の名前と件数となります。

手前味噌な話で恐縮ですが、弊社「株式会社コムラッドファームジャパン」は全国で11位にランクインされました ^ ^

条件付きの件数カウントも楽々です。

これくらいならExcelでも簡単にできるかもしれませんが、さらにもう少し細かく条件を指定したいと思います。
銀行や公的な機関は、相談件数も多いでしょうから必然的に支援件数も多くなります。
民間企業だけでカウントした場合のランキングがどうなるのか知りたいところです。
そのため、以下のように実行してみました。

(プロンプト)
「認定支援機関名」をカウントしてください。その際、「銀行」や「信用金庫」「商工会連合会」「商工会議所」「組合」と付くものは除いてカウントしてください。その結果の上位20位の名前と件数を出力してください。

(出力結果)
「銀行」、「信用金庫」、「商工会連合会」、「商工会議所」、「組合」といったキーワードを含む名前を除外した「認定支援機関名」の上位20位の名前と件数は以下の通りです:

1. ゼロス税理士法人: 68件
2. 株式会社フラッグシップ経営: 53件
3. 北浜グローバル経営株式会社: 45件
4. 株式会社エフアンドエム: 30件
5. 株式会社コムラッドファームジャパン: 26件
6. 坪井 亮: 23件
7. 株式会社SoLabo: 22件
8. シェアビジョン株式会社: 21件
9. 株式会社meditips: 17件
10. 一瀬 章: 15件
11. 東京中央経営株式会社: 14件
12. 行政書士法人jinjer: 14件
13. 株式会社アクセルパートナーズ: 14件
14. 株式会社ゼロプラス: 14件
15. 株式会社シャイン総研: 13件
16. 塩津 友輝: 13件
17. 立野 靖人: 13件
18. 合同会社G&N: 13件
19. チームコンサルティング株式会社: 13件
20. A-MEC株式会社: 12件

これらが指定の条件を除外した「認定支援機関名」の上位20位の名前と件数となります。

民間企業ランキングでは、弊社「株式会社コムラッドファームジャパン」は5位になりました!
それはさておき、従来であればExcelでどうやって関数を組み合わせようかと考えないといけないところ、日本語の指示1つであっという間に出力してくれる、ChatGPTの「Code Interpreter」は本当にすごい機能だと思います!

ちなみに、グラフを出力することも可能です。

(プロンプト)
今の出力結果をグラフで表示してください。

(出力結果)

「認定支援機関名」(特定のキーワードを除外)の上位20位をグラフで表示しました。グラフは上位から下位への順で表示しています。

ただし、一部の日本語文字が正しく表示されていない場合があります。これは使用しているフォントに含まれていない文字があるためです。必要であれば、出力結果を別のソフトウェアや環境で可視化することをおすすめします。

グラフは日本語が文字化けしてうまく出力されませんでした。
文字化けの対応方法は調べてみたいと思いますが、とりあえずグラフは簡単にできるということはわかりました。
グラフも楽々作ることができそうです。

キーワード分析はできるのか?

最後にキーワード分析ができるかの確認です。
読み込んだExcelファイルには「事業計画の概要」という項目があって補助事業の概要が簡潔にまとめられています。
この概要の頻出キーワードを見てみたいと思います。

(プロンプト)
「事業計画の概要」に書かれている内容に書かれているキーワードを分析して、頻出のキーワード上位30を出力してください。

(出力結果)
キーワードの分析を行うには、以下の手順をとります:
1.「事業計画の概要」のテキストデータを取得
2. テキストを単語に分割
3. ストップワード(頻出するが意味を持たない言葉)の除去
4. 単語の頻度をカウント
5. 上位30のキーワードを出力

まず、テキストの単語分割には日本語の形態素解析ツールを使用します。今回は「MeCab」という形態素解析ツールを使用して単語に分割し、その後頻度のカウントを行います。

それでは、キーワードの分析を始めます。

申し訳ございません。現在の環境にMeCab(形態素解析ツール)がインストールされていないため、エラーが発生しました。

代わりの方法として、簡易的なキーワード分析を行い、頻出のキーワードを抽出します。ただし、この方法では日本語の文法に基づく正確な単語の分割は難しいため、完璧な結果は期待できません。それを踏まえて、進めてもよろしいでしょうか?

(中略)

簡易的なキーワード分析の結果、頻出するキーワード上位30位は以下の通りです:
そこで: 127回
本事業では: 101回
当社は: 92回
本事業は: 80回
これにより: 42回
そのため: 36回
売上: 27回
現在: 22回
具体的には: 22回
新たに: 21回
... (以下略)

この方法では、具体的なキーワードや短いフレーズをよりよく抽出することができました。ただし、完璧なキーワードの分析ではなく、一部の文脈や意味合いが失われる可能性があります。

ということで、現状の機能では詳細なキーワード分析は難しいようです。
簡易的なキーワード分析では求めている出力結果は得られませんでした。
ただ、もしかするとプロンプトの工夫によってもう少し欲しい情報に近づけるかもしれません。

まとめ

ということで、今回はChatGPTの「Code Interpreter」を使ってみました。
データに対して様々な加工や処理をしたいとき、従来はExcelを駆使してやっていた作業などは、ChatGPTを使うことであっという間にできるようになりました。
テキスト入力しかできなかった時は入力できる文字数制限があり、長文を読み込ませるのに工夫が必要だったり、うまく読み込んでくれず出力が不安定になってしまう問題がありました。
「Code Interpreter」を使えば、長文が書かれたファイルも読み込ませることができるので、入力時の文字数制限は気にしなくても良くなるものと思われます。

もちろん情報セキュリティという観点から、どんなファイルでも読み込ませれば良いということではありません。
機密情報が含まれた情報を読み込ませると、ChatGPTがその情報をあらぬ方向で2次利用してしまう可能性も考えられます。
便利な機能ではありますが、扱ってもいいデータ、そうでないデータは意識しておかなければいけません。

それでは。

この記事が気に入ったらサポートをしてみませんか?