見出し画像

ChatGPTを使用して手入力データ作成から解放されたい~Tableauに使用するデータ作成~

今回はDATA Saberの試練であるPublicコミュニティポイント「Tableau PublicへのViz投稿」について取り組むにあたり生成AIを活用したことについてお話ししたいと思います。

生成AIを使用しようと思ったきっかけ

突然ですが、私の趣味はプロ野球観戦です。仕事のタイミングが許す限り、神宮球場に通い、現地参戦できない日は自宅でDAZNの中継を観る毎日を過ごしています。
そんな毎日を過ごしているのでプロ野球に関するVizを作成してみようと思うのは当然の流れでプロ野球に関するデータを探していました。
まず手始めに思いつくのはNPB:日本野球機構の公式サイトから統計データを取ることです。サイトには統計データがあったのですが、問題は形式でした。
セントラル・リーグ年度別入場者数(1950-2023)というpdfファイルがカーソルを当ててコピーすることができなかったのです。
ワクワク気分だった私からするとアナログ入力しかない事実突きつけられガックリしました。
どうにかしてアナログ入力することを避ける方法はないかと思ったところにふと思いついたのがChatGPTを活用することでした。「そうだ、ChatGPTに文字起こししてもらおう!(できるかわからんけど)」

ChatGPTを使用してみる

なんとかしてこのPDFファイルから文字起こしをできないかと調べてみたところ、文字を抽出する方法をなんとか見つけました。
ChatGPTには取り込んだファイルを参照する機能があり、その機能を利用してファイル内の文字を抽出します。

1.ファイル取り込みを行う

2.指示文(プロンプト)を入力する
指示文は以下のようにしました。ここで期間を指定しないとかなりのデータ数になり、無料プランでは読み込みに時間がかかるので10年単位で指定をしました。それでも6球団×10年分=60行になるので無料プランだとレスポンスがかなり遅めです。

プロンプト文「読み込んだファイルから球団名、球団別入場者数、年度と列がなるように表を作成してください。対象年度は2000年から2010年までとしてください。」

3.回答文をコピーしてExcelに貼り付け
Excelに直接貼り付けできるので、1つ1つ手入力をせずに済みました!
ただ、無料プランですと1ファイル73年分(438行!)が限界で
上限文字数に達してしまいます。そうなると24時間後にまた利用が可能になるので待っていられない人は課金をお勧めします。(私は悩み中)

アナログなデータ作成から解放されよう

「このことに関してVizを作ってみたい」と思うことが多くありますが
データ収集が難しいということで諦めることがあります。そんな歯がゆい思いを払拭してくれるとても良いツールだと思います。指示文(プロンプト)次第でかなり可能性が広がるので、活用頻度を上げて指示文作成が上手にできるようになっていきたいと思います。

課金は当分しないと思います。それくらい無料プランが充実してます!!

この記事が気に入ったらサポートをしてみませんか?