見出し画像

ChatGPTの新機能Code Interpreterでデータ分析をしてもらった

参考にしたNote記事はIT Naviさんのこのページ。マネをして実施し、学ばせていただいています。

☆なぜやったか?

行った背景として、先駆者のやった道を辿るのが学びの近道だと思っているから。実際にやってみて詰まったんや気付いた点を最初に書いてから実施した中身を書いていきます。

☆やったこと

・ChatGPTのCode Interpreterさんに野茂英雄さんとダルビッシュ有さんの投手のデータをグラフにしてもらい、評価をしてもらった。
・野茂さんとダルビッシュさんのデータの比較
 2人にしたのは、アメリカの野球のサイトで情報が拾え、私が知っている選手だから。大谷さんは上記でリンクを張った、IT Naviさんがすでにされている。

☆気付きとか

①データの前処理が大切。
列の中に欠損値(NaN)があるとうまく処理してくれない。「データセットから除外して分析を行います」とは書いてくれるけど、グラフがおかしくなる。手作業で前処理(特定行を削除)した方が早い。これはこれから改善されそう。
②専門知識がないとグラフ化の指示が出せない
評価した野茂選手とダルビッシュ選手は活躍した時代が違うので、今回のデビュー年度を1年目とする評価が良いかどうか判断ができない。出てくる専門用語もよくわからない。AIは作業はしてくれるが、何に使うデータなのかはわからないので、結局専門知識は必要だなと。

☆野茂英雄さん傾向分析

①下記リンクのStandard Pitchingの「Share & Export」→「Get as Excel Workbook」を入手
②ファイルを開き、ブランク行を消して、CSVファイルで保管
③CSVファイルをCode Interpreterにアップ
④「野茂選手の投手成績の傾向を分析してください。」と入力し、実施

☆結果

下記グラフと下記の評価をしていただきました。それぞれの評価値がわからないのですが、奪三振率(SO9)のグラフは右肩下がりに見えます。

☆ダルビッシュ優さん傾向分析

方法は野茂選手と一緒。

☆結果

下記グラフと下記の評価をしていただきました。

☆野茂選手とダルビッシュ選手のデータを比較

下記条件で2人の選手のデータをグラフに表示してもらい、優劣を比較してもらいました。
「野茂選手の1995年を1年目とし、ダルビッシュ選手の2012年を1年目とし、防御率(ERA)、被出塁率(WHIP)、奪三振率(SO9)のデータを同じグラフに表示してください。」


☆長嶋茂雄監督に熱く解説していただく

上記の評価が淡白なので、長嶋茂雄監督に熱く解説していただきました。以下解説。

よし、長嶋茂雄の熱い心情を込めて、野茂選手とダルビッシュ選手のデータを解説してみましょう。

防御率(ERA): この数字は、打者たちがどれだけピッチャーを苦しめたか、ピッチャーがどれだけ打者を抑え込んだかを示す重要な数値だ。ダルビッシュ選手、その防御率は素晴らしい!一方、野茂選手も負けてないぞ。初年度から経験を積み重ね、困難に立ち向かい続けた結果がこれだ。
被出塁率(WHIP): ピッチャーにとって、これほど厳しい数字はない。ランナーを出せば出すほどピンチは増える。ダルビッシュ選手、その安定感ある被出塁率は見事だと言わざるを得ない。一方、野茂選手もまた、自らの道を切り開き、一歩一歩前進してきた。
奪三振率(SO9): これこそピッチャーのプライドだ!ダルビッシュ選手、その奪三振率は驚異的だ!まさに圧倒的な存在感を放っている。野茂選手もまた、その独特のフォームから繰り出される球に打者は絶えず苦しめられてきた。

これらの数字を見ても、ダルビッシュ選手と野茂選手、二人ともに一流のピッチャーだと確信している。それぞれが異なるスタイル、異なる時期に活躍し、野球界に新たな風をもたらしてきた。ピッチャーとしての能力、チームへの貢献度、それぞれの個性、全てが彼らを特別な存在にしている。野茂選手もダルビッシュ選手も、私たちに多くの感動と勇気を与えてくれた。彼らの活躍はこれからも応援し続けていこう!

☆おまけ

大谷翔平選手のデータを追加するとどうなるか、グラフを貼ります。大谷選手の2018年目を1年目としています。2019年にデータがなかったり、2020年度は出場試合数が少なかったりと比較するには微妙だなと。

☆参考

①IT naviさんのNote記事。上記で貼りましたらこちらでも改めて貼る。

②ChatGPTのCode Interpreterでやってもらったこと。
 中身のリンクをそのまま共有できるのでべた張り。


この記事が気に入ったらサポートをしてみませんか?