![見出し画像](https://assets.st-note.com/production/uploads/images/110597227/rectangle_large_type_2_569dabccbf57a221a73828cab6884371.jpeg?width=800)
ChatGPTのCode Interpreterとは何なのか?何ができて何がスゴいのか?
ChatGPTの新機能として一般公開されたCode Interpreterがすごすぎて結構感動しているのだが、Code Interpreterで色んなことができるが故に「一言で言うと何なのか?」「一体それでなにができるのか?」疑問に思っている人も多いのではないだろうか?
このnoteではそうした疑問に答えるべき、まず最初にCode Interpreterでできることを紹介した上で、最後に一言でこれを説明すると一体なんなのかを紹介していきたい。
Code Interpreterで主にできること
1. データ分析とビジュアライズ
まずこれが最もベーシックな使い方だろう。
特定のデータセットをエクセルファイルやcsvファイルでアップロードすると、そのデータの中身を読み取ってくれて、ビジュアライズしてもらうことができる。
ビジュアライズの際の分析の切り口やデザインを細かく指示することも、ChatGPTに良い感じに自分で考えて出してもらうことも可能だ。
ChatGPTで新しく解放された「Code Interpreter」が優秀すぎて結構ビビってる…。
— KAJI | 梶谷健人 (@kajikent) July 9, 2023
政府の宿泊客数に関する公開データをデータ整形してビジュアライズするとか一発でできる… pic.twitter.com/ZPbvNzSEI7
以下のように複数のデータセットの数値を組み合わせて散布図を作るなども簡単に実現できる。
ChatGPTのCode Interpreterを使ってコロナ感染の公開データから都道府県別の感染率と死亡率の散布図も簡単につくれた。
— KAJI | 梶谷健人 (@kajikent) July 9, 2023
もはや簡単なチャート作成はアシスタント要らずでバンバンChatGPTにつくってもらえるな…。 pic.twitter.com/DoTIHFqw5A
2. 長期記憶の実現
ChatGPTは会話が長くなると記憶が抜け落ちていく限界があったのだが、Code Interpreterで記憶保存用のテキストファイルをはじめに作らせ、毎回のやり取りをそこに保存して、応答を生成する際に関連する情報を参照するようにすると長期記憶が実現できる。
ChatGPTではスレッドが変わると記憶が引き継がれないという限界もあるのだが、この手法では記憶ファイルをアップロードし直すだけで記憶を引き継ぐことが可能になる。
ChatGPTは会話が長くなると記憶が抜け落ちていく限界があったけど、Code Interpreterで記憶保存用のテキストファイルをはじめに作らせ、毎回のやり取りをそこに保存するようにすると長期記憶が実現できる。
— KAJI | 梶谷健人 (@kajikent) July 9, 2023
1~2枚目がプロンプトを含むやり取り
3枚目が実際にChatGPTがアップデートしてくれたファイル pic.twitter.com/bQDJ0jpKEB
3. 画像ファイルのOCR(文字認識)
Code Interpreterで画像のOCR(文字認識)もできる。
例えば画像データになっている契約書や請求書を読み取らせて何かしらの処理をさせることも可能だ。
現状は日本語でのOCRはうまく動作せず英語のみになるが、日本語対応するのも時間の問題だろう。
すげえ…!ChatGPT Code Interpreterで画像のOCRもできる!
— KAJI | 梶谷健人 (@kajikent) July 9, 2023
1~2枚目が入力と処理のスレッド、3枚目が読み込ませた画像。
ただし、4枚目のように日本語ではまだOCRが動作せず、、 pic.twitter.com/X9il38ioCZ
4. gitのレポジトリ全体を読み取らせてコードの修正や生成
gitのレポジトリ全体をZipでアップロードして処理させることもできるらしい。
ChatGPTのCode Interpreter、gitのレポジトリ全体をZipでアップロードして処理させることもできるのか。
— KAJI | 梶谷健人 (@kajikent) July 11, 2023
普通に強力すぎるな笑https://t.co/W8bC4xE2P7 pic.twitter.com/o2kr2JO4pV
5. 良い感じのデザインのインタラクティブなデータダッシュボードの作成
NetflixのKaggleに上がっているオープンデータをアップロードして、「Netflix的なデザインでインタラクティブなデータダッシュボードを作って」と指示しただけで、本当にそれが実現できてしまった…。
ChatGPTのCode Interpreterやっぱ凄すぎる。
— KAJI | 梶谷健人 (@kajikent) July 12, 2023
この人のツイート参考に、NetflixのKaggleに上がっているオープンデータをアップロードして、「Netflix的なデザインでインタラクティブなデータダッシュボードを作って」と指示しただけで、本当にそれが実現できてしまった…! https://t.co/6b3qJv8J78 pic.twitter.com/0eBcw9I7eu
6. 簡易なエフェクトを加えながらのGIFから動画への変換
以下ツイートのようにGIF映像にカメラがズームしていくエフェクトを加えながらMP4ファイルに変換することも可能。
Basic video editing in ChatGPT, converting uploaded GIF to longer MP4 with slow zoom: pic.twitter.com/fmCPUBkedD
— Riley Goodside (@goodside) April 30, 2023
Code Interpreterとは一体なんなのか?
「Code Interpreter」は一言で言えば、「ChatGPT上で"コードの実行結果を提供できる"機能」だ。
いままでのChatGPTでは何かやりたいことを伝えて、それを実現するためのコードを生成してもらうところまではできたが、そのコードをChatGPT自体に実行して結果を返してもらうことはできなかった。
しかし、「Code Interpreter」ではその「コード実行」と「結果の提供」まで担ってくれる機能というわけだ。
ではなぜ「Code Interpreter」でここまで紹介したような幅広いタスクが実現できているかと言えば、Pythonのライブラリの一部を実行できるからだ。
Pythonのライブラリのうち、データのビジュアライズや、画像処理などに特化した機能を呼び出して実行しているため、結果として非常に幅広いタスクを実現できている。
まだCode InterpreterからアクセスできるPythonのライブラリに制約があったり、Webリンクにアクセスできないなどの限界があり、今すぐに凄まじいインパクトを生むというものではないが、こうした制約や限界が徐々になくなったどこかのティッピングポイントで大幅に人間の業務を代替してくれる存在になるのが、このCode Interpreterだと思っている。
みなさんもぜひ今のうちに積極的に触ってみて、真にCode Interpreterが力を発揮するタイミングでいち早く活用できるように準備していきましょう。
さいごに
生成AI領域を自社事業に活用したい企業の顧問・コンサルティングの仕事をお受けしております。ご興味がある企業の方はお気軽に会社サイトのフォームやTwitterなどでご連絡頂けますと幸いです。
AIやXRなどの先端テック、プロダクト戦略などについてのトレンド解説や考察をTwitterで日々発信しています。 👉 https://twitter.com/kajikent