もう一段階深く理解する、Code Interpreterの仕組みについて
Code Interpreterって何?
今までのGPT4のモデルにプラスアルファでpythonの処理を出来るようになった、新しいGPTモデルです。
Pythonを導入した結果、こんなことが新しく出来るようになりました。
ざっくり紹介します。詳細は「出来ることの違い」に記載します。
思考プロセスの違い
Code Interpreterが何が出来るのか?今までのGPT4のモデルとは何が違うのかを理解するには、まずは今までの既存のGPT4のモデルとCode Interpreterの思考プロセスの違いについて学ぶのが理解への一番の近道です。
Code Interpreterの場合:
既存のGPTモデルの場合:
この違いを見てもらったら一目でわかるようにCode Interpreteは既存のGPTモデルに加えて、その過程で一度
自然言語→プログラミング言語→自然言語
に変換するという作業が加わりました。
これによりPythonでの処理を挟めるようになったため、今までのAIモデルの推論では苦手であった、統計やデータ分析等のLLMの苦手分野をPythonを使うことによって克服しました。
まとめ
難しい説明をしましたが、ざっくり言うと要は
別角度から物を考えれるようになった。
その結果数学が得意になって、プログラミングも実行できるようになった。
です。
何ができるようになったのか?
入力形式が増えた、出力形式が増えたプログラミングのコードを実際にブラウザ上で実行できる、数学が得意になった大体この4つが出来るようになりました。
入力形式
以下のファイル形式に対応しました。
テキスト(txt)
データ形式(csv,xml,json 等)
Microsoft オフィスファイル(docx, xmlx, pptx 等)
画像ファイル(jpg, png, bmp, gif 等)
PDFファイル
ZIPファイル
QRコード
プログラムやhtml,csv などのソースコード
動画ファイル(mp4, avi, mov)
ただし、あくまで理解を出来るのはテキストのみで、画像や動画、その他のテキストベースではないファイルに関しては取り込めて、「さっきのファイルを出して」とお願いすれば出力できますが、その内容は理解していません。
ですので基本的に使えるのは
txt,csv,pdf,プログラミングコード
この4つぐらいでしょう
出力形式
出力形式は多岐にわたり、大体の図やグラフは出力できます。
多すぎて全部はリストアップ出来ないので、その都度GPTに適切な形を聞いて、出力してもらいましょう。
データテーブル
グラフ
チャート
ヒストグラム
散布図 (Scatter plot)
実際の成果物
注意点
グラフや図は日本語のフォントに対応していません。そのため英語での出力を指示しないと以下のように文字化けして出てしまいます。画像1参照
グラフや図を保存する際は最後に.pngと付け、拡張子を変更しましょう。
でないと画像として見れません。
プログラミングを実行できるようになった
これはPythonを思考プロセスに入れた副産物のようなものです。
ユーザーから見た恩恵としては、プログラミングのエラー解析を直接してもらえるようになった。これぐらいだと思います。
数学が得意になった
今までのLLMモデルはどれも次の文字や単語や文脈を予測するというアルゴリズムで動いており、その仕組みは計算には不向きでした。
そのため簡単な計算でも間違った答えを出してしまうことが多々ありました。
ですが、Code Interpreterから思考プロセスにpythonが導入されたことによって、今までの言語的処理ではなく、数学を数学的処理をすることが出来るようになり、これにより数学に関する精度がかなり向上しました。
またプロセスにpythonを使うこともあり、専門的な統計の計算が出来るようにもなりました。
ChatGPTを使って数学の問題を解いたり、議論をしたりする場合は既存のGPT4モデルではなく、Code Interpreterを使用しましょう。
この記事が気に入ったらサポートをしてみませんか?