見出し画像

チャットGPTの分析機能を使って機械学習のモデルを作成する

競馬の予測のためにどのような分析が良いかのプロンプトをいろいろ試してみたが面白そうな分析方法は得られないですね。あまりにも賢いのでついつい斬新な答えを期待しますが、Web上にあるコンテンツ以上のものを新しく生み出してくれるわけではないので仕方ないです。

それならばと、まだ試していなかった旧code interpreter、今は新しくなって分析機能?を試してみます。(有料で使用しているので無料バージョンが利用できるかは分かりません)

この機能を使って機械学習のモデルを作成して朝日フューチュリティの予測に使ってみます。データセットとして朝日フューチュリティの過去10年間のデータを使用し、3位以内に入る馬の予測をするモデルを作成したいと思います。

データはnetkeibaの情報を使用します。データは多くないのでスクレイピングでもページの保存でも良いと思います。
これらの情報をPandasのデータフレームにしてからcsvファイルとして保存します。csvファイルは下記のようになります。

このデータをチャットGPTにアップロードして次のようなプロンプトで尋ねてみます。

すると、手順を丁寧に説明してくれます。

ChatGTPから提案がありますのでそのまま進めます。
私:「アップロードしたデータセットを開いて内容を確認して下さい。」
ChatGPT4:「データセットには以下の列が含まれます。・・・次に、これらの特徴をどのように処理するかを決めるためのデータの探索と分析を行いましょう。」
私:「データの探索と分析をお願いします。」
ChatGPT:・・・

機械学習の知識があまりなくてもデータの前処理の方法を提案してくれるので内容を確認しながら進めます。1着の着差がNAとなっているので0に修正してもらいます。
そしてモデルの構築に進んでもらいます。
私:「モデルの構築に進んで下さい。」

エラーが発生しますが、修正方法などを提案してくれます。着差はタイムは同じ内容なので除外して進めてもらいます。

モデルをランダムフォレスを使用して作成してくれました。
3位以内の精度が高くないのでパフォーマンス向上の提案をしてくれます。

ロジスティック回帰、サポートベクターマシン、勾配ブースティングマシンを試してもらいましたが今回のデータではランダムフォレストが優れているとのことです。次にハイパーパラメータのチューニングもお願いしましたが、グリッドサーチ、ランダムサーチともに時間制限で完了できませんでした。

機械学習の知識がなくてもいろいろ提案してくれるので基本的にお願いモードでいけばなんとかモデルは完成します。消化不良の部分も多いですが本当にモデルまで作成してくれるとはすごいです。もちろん高い精度を求めるためにはより深い統計学の知識が必要になりますが、勉強のためには非常に役に立つと思います。

完成したモデルは「モデルをファイルに出力して下さい」と依頼してファイルを保存しておきます。このモデルを使って出馬表が発表されたら予測を行なってみます。

モデルの使い方も「モデルの使い方を教えて下さい」と聞けば丁寧に教えてくれるので安心です。

さて、予測が楽しみです。

この記事が気に入ったらサポートをしてみませんか?