Code Interpreterを使いこなす!実践15パターン
ChatGPTの「Code Interpreter」プラグイン、大人気ですね。私も使い始めてから、その便利さと面白さを実感しております。
Code Interpreterで何ができるかについては、SNS等でたくさん情報が上がっていますが、実際どうやってやるの?簡単にできるの?という疑問をお持ちの方もいるかもしれません。私もそうでした。ということで、実際にCode Interpreterでできそうなことをまとめて片っ端から試してみました。今回はその実験結果のレポートです。使用したプロンプトも添えます。
本当は30パターンくらいあったのですが、ちょっと多すぎるので半分の15パターンに絞りました。省いた15パターンを含め、これから他にも色々な使い方が出てくると思うので、第2弾でご紹介できたらいいなあと。
Code Interpreterの使い方
1. ChatGPT Plusに加入する
Code Interpreterは現在、ChatGPT Plusユーザー限定の機能なので、Code Interpreterを使用するにはChatGPT Plusに加入する必要があります。ChatGPT Plusは月20ドルですが、私個人的にはその金額以上の価値を感じています。いつでも解約できるので、是非一度試してみてください。
2. Code Interpreterを有効にする
ChatGPTの設定画面(メールアドレスをクリック -> Settings)で、Code Interpreterを有効にします。これで準備完了。
3. Code Interpreterを選択する
ChatGPTのチャット画面で、「GPT-4」にカーソルを合わせると、以下のようにドロップダウンリストが表示されるので、「Code Interpreter」を選択します。
4. アップロードするファイルを選択する(オプション)
Code Interpreterを選択すると、以下のように「+」ボタンが表示されます。そこから必要に応じてデータファイルをアップロードできます。
使い方の基本は以上です。ではここから実践15パターンをご紹介します。
1. データ分析&グラフの作成
「+」ポケモンのデータセット(CSVファイル)をアップロード。(Kaggleにあるデータセットを使用)
このようにファイルの内容を分析して、指示通りのグラフを作成してくれました。データセットでは、ポケモンの名前やタイプといった各項目は英語で書かれていましたが、日本語に翻訳して出力してくれてます。
グラフの上にある「Show work」のタブをクリックすると、グラフの生成に使用されたPythonコードを確認することができます。
因みにですが、ポケモンには日本語名と英語名で呼び名が違うキャラクターが結構います。上記のグラフもそうですが、パッと見どのポケモンかわからないので、変換をお願いしてみました。
ここではダメでしたが、追加のデータセットを渡せば可能であることがわかりました。そしていずれインターネット接続が有効になれば、それすら不要になるということですね。すげ。
2. インタラクティブなグラフの作成
「+」先ほどと同じポケモンのデータセット(CSVファイル)をアップロード。
このように、クリックしたり、ドラッグしたり、グラフのデータを操作できるインタラクティブなグラフを簡単に作成できました。棒グラフだけでなく、もちろん円グラフだって作成できます。インタラクティブグラフはHTMLファイルで生成されます。
3. グラフで日本語を表示
グラフでは日本語が正しく表示されないので、フォントファイルをCSVファイルと一緒に渡して試してみます。
「+」成績表のサンプルCSV + Noto Sans JPフォントをアップロード。
指示通りに作成されました。ただ分析に誤りがあるので、全てを鵜呑みにしない方がいいですね。
CSVファイルが文字化けしている場合でも、自動でエンコーディングを行ってくれるので非常に便利です。
4. ソースコードのファイル分析
「+」Simple Tweet Editor の page.tsx ファイルをアップロード。
説明はほぼ完璧です。このコードは何を意味するのか、この関数では何が行われているのかを言語化してくれるのは嬉しいですね。これなら技術ブログの記事も爆速で書けそうです。いや、もはや技術ブログを書く必要もなくなるか…。
5. 複数のソースコードのファイル分析
「+」Simple Tweet Editor のファイルを丸ごとアップロード。
プログラミング初心者の方にとっては、一つ一つ調べずともこのように解説してもらえると助かりますね。最高のプログラミング学習メンターです。
「3. tweet-editor-example.png: プロジェクトに関する画像ファイルです。おそらくREADMEなどで使用されていると思われます。」<- この推測も当たってます。
6. プロンプトのみでグラフを作成
データセットをアップロードしなくても、プロンプトのみでグラフを作成できるので、使い方の幅が広がります。
7. 画像(JPG)ファイルの作成
簡単なイラストを作成できるようですが、イラストなら画像生成AIを使用した方が間違いなく良いので、文字の画像ファイルを英語と日本語それぞれ作成してみます。
英語テキスト
「+」Robotoフォントをアップロード。
日本語テキスト
「+」Noto Sans JPフォントをアップロード。
テキストは自動で折り返されないので、プロンプトで改行して提示すると良いです。「読点(、)の後に改行して」のように指示することも可能ですが、行が重なってしまうので、追加で行間の幅を指示する必要があります。
詳細の指示を英語で書いている理由は、日本語だと指定したフォントサイズが適用されなかったりなど、うまくいかないことが多かったためです。GPT-4で日本語の精度が上がったとはいえ、やはり英語を使った方が安定します。
8. 画像ファイルの修正
先ほど作成したジョブズの名言画像(英語の方)を修正してみます。(7の続きを実行)
作成した画像を続けて編集する場合は、このように簡単にできます。しかし画像ファイルをアップロードして編集する場合は、画像の詳細情報を提供する必要があるので、少し面倒な作業になります。その場合は、最初から作り直して編集した方が早そうです。
9. 画像の文字の読み取り
今度は画像中のテキストを文字データに変換する実験です。またまたジョブズの名言画像を使って試してみます。
「+」画像ファイルをアップロード。
英語テキスト
日本語テキスト
上記の通り、日本語のOCRにはまだ対応していないようです。英語テキストの画像ではしっかり機能しています。
最近のGoogle Bardのアップデートで日本語のOCRが可能になったようなので、しばらくはそちらで代用できそうです。
10. 簡単なGIF画像の作成
私のプロフィール画像を使用して、回転するだけの簡単なGIF画像を作成してみます。
「+」プロフィール画像をアップロード。
フレーム数やフレームの間隔を指定することもできますが、そうでない場合は提案してくれます。非常に有能です。
「時計回り」「右回り」と指示してもなぜか左回転の画像になってしまうのですが、「生成されたGIF画像を逆回転にして」と追加の指示を出したら成功しました。検証していませんが、これも言語の問題かもしれません。
11. ちょっと複雑なGIF画像の作成
同じプロフィール画像を使用して、パズルのようなGIF画像を作成してみます。
「+」プロフィール画像をアップロード。
細かく指示を与えれば、このように割と複雑なGIF画像も作れてしまいます。1番のピースが置かれた状態から始まってしまっていますが、追加の指示で簡単に修正できそうです。
12. パノラマ画像を動画に変換
「+」パノラマ画像をアップロード。
使用するライブラリやフレームレートなどを指定することもできますが、特になければおまかせで作ってくれます。
もう少し複雑な動きにしたい場合は、英語プロンプトの方がいいかもしれません。やっぱり日本語だとうまくいかないことが多いです。
13. 動画をGIFファイルに変換
「+」動画ファイルをアップロード。(Pixabayの動画を使用)
「可能な限り容量を小さく」と雑に指示したところ、動画から5枚のフレームが抽出され、GIFファイルが作成されました。もちろんフレーム数を指定することも可能です。フレーム数を増やせばもっとスムーズなGIFアニメーションになります。
14. GIFファイルを動画に変換
「+」GIFファイルをアップロード。
GIF -> 動画も可能です。ページ容量削減のため、ここはファイルの掲載を省きます。
15. URLからQRコードを作成
私のnoteのURLを使ってQRコードを作成してみます。
Google レンズで読み取ってみると、ちゃんと機能しました。めちゃくちゃ簡単ですね。
Code Interpreterはまだベータ版なので、すぐに仕様が変わったり、できないことができるようになったりする場合があります。今回ご紹介した情報は、2023年7月15日時点の情報であること、また例と同じプロンプトを使用しても必ず同じ結果になるとは限らないことをご承知ください。
最後までお読みいただき、ありがとうございました!
この記事が気に入ったらサポートをしてみませんか?