見出し画像

ChatGPT のCode Interpreterでタイタニック号の予測をやってみる

ChatGPTのCode Interpreterが公開されたので、早速ためしてみました。ネタは、定番のKaggleのタイタニック号の予測をやってみます。

それではタイタニック号の予測のトレーニングデータをChatGPTにアップロードして、ざっくりEDA を依頼するところから始めてみます。

特徴量エンジニアリング(EDA)

Pythonのpandasを使ってデータ分析を始めてくれました。
生成されたコードにいい感じにコメントが付いているのも好印象ですね。
私が英語が苦手なのを察知して日本語で説明してくれました。
seabornで可視化して解説してくれました。
女性 や子供の生存率が高いなど基礎的なところをキチンと押さえてくれています。
運賃や家族の人数について洞察力を発揮しています。
欠損値の処理も自動でおわりました。

モデルの訓練および評価

EDA再検討

Test データの予測

テストデータにも欠損があるので、適宜修正をしてくれます。
 エラーが発生しても、ChatGPTの提案通り進めてもらうことで解決できます。

testデータの予測結果が出力されました。早速kaggleで採点してみます。

KaggleのSubmit結果

全自動でここまでイケるのはかなり優秀だと思います、いかがでしょうか。

感想ほか

  • 入力したデータに対して、ChatGPT自身がpythonのプログラムを書いて、コツコツとエラーを解決していって、最終的にいい感じに目的のファイルを出力してくれました。

  • 今までも外部プラグインのNotableなどを使うと同様のことは出来ましたが、そちらはpythonの実行環境が外部にあったため、エラー処理や実行結果の反映が上手くいかない場合もあり、二人羽織状態というか若干もどかしい印象もありましたが、Code Interpreterだとスムーズに検討を進めることができました。

  • OpenAI 社は話題づくりのためか、機能を小出しでコンスタントに発表にしている印象がありますね。あと、どれ位のネタを仕込んでるんでしょうか…。楽しみですね!😆

夢中で触っているとすぐChat回数の制限に到達してしまうのが玉にキズですが、ぜひ実際に触ってみることをお勧めします。

最後までご覧いただき、ありがとうござました。

この記事が参加している募集

#AIとやってみた

28,552件

この記事が気に入ったらサポートをしてみませんか?