課金をするなら Chat GPT か Claude か - 第二弾
という記事を書いたことで、もう少し Chat GPT と Claude の能力比較をしてみたくなったので試してみた。
今回は単純なCSV の分析を依頼する。
Chat GPT と Claude 共に 課金したもので試した。 (Chat GPT Plus / Claude 3 Opus)
分析の前提
データソース
神戸市市営地下鉄の乗車数 - 神戸市オープンデータ
プロンプト
プロンプトもできる限り簡潔にしてみた。
試行した結果の評価
結論から先に述べる。
あまりに身のないデータと簡潔なプロンプトでは 両者を使用する意味もないが、少々の視点の違いは面白い。
Chat GPT は 比較することに重きを置いている感がある。
Claude は 差異についてピンポイントで押さえに行く感がある。
今回の結果では達成できなかったが、正確なプロンプトを指示することChat GPT はかなりレベルの高いチャートの作成を行うことが出来るので、データの分析・まとめを行うにはChat GPTが良いと個人的には感じている。
Chat GPT Plus
タイプで言うと真面目系エンジニアタイプ。
作業内容は逐一報告してくるし、分析の元データの内容についても事細かに述べてくる。
最終的にチャートを作成しそこねて分析が中断してしまった。
提案された質問
どの駅が最も利用者数が多いか?
曜日ごとの利用者数の違いはどのようになっているか?
平日と休日での利用者数の違いはどのようになっているか?
定期券(通勤、通学)とICカード(大人、小児)の利用者数の比較はどうか?
月ごとの利用者数の変動はどうか?
Claude 3 Opus
タイプで言うと俺に任せとけコンサルタイプ。
逐次の作業内容の報告は一切せず、自分自身の理解を述べてくるスタイル。
提案された質問
質問1: 乗客数が最も多い曜日は何曜日ですか?
質問2: 三宮駅と新神戸駅では、どちらの駅の利用者が多いですか?
質問3: 2019年から2022年にかけて、乗客数はどのように推移していますか?
質問4: 8月13日〜16日の乗客数が例年より少ないのはなぜですか?
質問5: 1日あたりの乗客数が最も多かった日はいつですか?また、その乗客数は何人ですか?
Chat GPT plus
出力結果
CSVファイルを読み込もうとした際に、エンコーディングの問題が発生しました。日本語のデータが含まれている可能性が高いため、適切なエンコーディングを指定してもう一度読み込みを試みます。日本でよく使用されるエンコーディングは「shift_jis」ですので、それを使用してファイルを読み込んでみます。
ファイルの読み込みに成功し、データの概要を確認しました。以下はその内容です:
日付: データの記録日
曜日: 記録された日の曜日
駅: 駅名
定期(通勤): 通勤目的での定期券利用者数
定期(通学): 通学目的での定期券利用者数
IC大人: 大人のICカード利用者数
IC小児: 小児のICカード利用者数
不要な列(Unnamed: 7, Unnamed: 8, Unnamed: 9)が存在しており、これらはデータ分析には不要ですので、除外します。また、データをよりよく理解するために、以下の5つの質問を提案し、それぞれに答える形で分析を進めます:
データ分析の結果
以下に、提案した質問に基づくデータ分析の結果をまとめます。
どの駅が最も利用者数が多いか?
三宮駅が33,397,863人で最も利用者数が多く、次いで西神中央駅が13,141,902人です。
曜日ごとの利用者数の違いはどのようになっているか?
金曜日が最も多く、約7,709,845人です。週末や祝日に比べて平日の方が利用者数が多い傾向が見られます。
平日と休日での利用者数の違いはどのようになっているか?
平日が36,452,523人と休日(10,087,242人)よりもかなり多い利用が見られます。
定期券(通勤、通学)とICカード(大人、小児)の利用者数の比較はどうか?
ICカード大人の利用が最も多く、23,020,022人。通勤定期券は17,625,493人、通学定期券は5,812,330人です。小児のICカード利用は非常に少ない(81,920人)。
月ごとの利用者数の変動はどうか?
3月が最も利用者数が多く、4,838,507人です。夏の時期(特に8月)にかけて利用者数が減少する傾向が見られます。
これらの結果を視覚的に表現するために、最も重要なデータポイントをグラフで示します。具体的には、「各駅の総利用者数」、「曜日ごとの利用者数」、「平日と休日の利用者数比較」の3つのチャートを作成します。
… 分析を停止しました …
Claude 3 Opus
出力結果
添付のCSVデータを分析し、神戸市営地下鉄の利用状況について以下の5つの質問に答えます。また、データの理解を助けるためのチャートも作成します。
質問1: 乗客数が最も多い曜日は何曜日ですか?
回答1: 金曜日が乗客数が最も多い曜日です。平日の中では、金曜日の乗客数が他の曜日と比べて consistently 高くなっています。
平日の曜日別平均乗客数:
月曜日: 13,058
火曜日: 13,147
水曜日: 12,974
木曜日: 13,156
金曜日: 13,235
質問2: 三宮駅と新神戸駅では、どちらの駅の利用者が多いですか?
回答2: 三宮駅の利用者数が新神戸駅と比べて圧倒的に多いです。三宮駅は新神戸駅の利用者数の約2倍となっています。
駅別の平均乗客数:
三宮駅: 10,327
新神戸駅: 4,422
質問3: 2019年から2022年にかけて、乗客数はどのように推移していますか?
回答3: 2020年は新型コロナウイルスの影響で大幅に乗客数が減少しました。2021年には少し持ち直したものの、2019年の水準までは回復していません。2022年に入ってからは、ほぼ2019年の水準に近づいてきています。
質問4: 8月13日〜16日の乗客数が例年より少ないのはなぜですか?
回答4: 8月13日〜16日は毎年お盆休みの時期にあたります。多くの人が帰省や旅行に出かけるため、都市部の公共交通機関の利用者が減少する傾向にあります。神戸市営地下鉄でも、この時期は乗客数が平常時と比べて少なくなっています。
質問5: 1日あたりの乗客数が最も多かった日はいつですか?また、その乗客数は何人ですか?
回答5: 2019年12月14日の土曜日が、データ上で1日あたりの乗客数が最も多い日でした。この日の乗客数は41,274人でした。
乗客数上位3日:
2019-12-14(土曜日): 41,274人
2019-12-13(金曜日): 40,781人
2019-11-29(金曜日): 40,214人
チャート1: 平日の曜日別平均乗客数
月曜日 火曜日 水曜日 木曜日 金曜日
┌───┐ ┌───┐ ┌───┐ ┌───┐ ┌───┐
│ │ │ │ │ │ │ │ │ │
│ │ │ │ │ │ │ │ │ │
│ │ │ │ │ │ │ │ │ │
│ │ │ │ │ │ │ │ │ │
13000┤ │█│ │█│ │█│ │█│ │
│ │█│ │█│ │█│ │█│ │
│ │█│ │█│ │█│ │█│ │
└───┘█└───┘█└───┘█└───┘█└───┘
█ █ █ █
█ █ █ █
█ █ █ █
12500┴────┴─────┴─────┴─────┴─────
チャート2: 三宮駅と新神戸駅の平均乗客数比較
三宮駅 新神戸駅
█
█
█
█ ┌───┐
█ │ │
█ │ │
10000┬───█─────────────┤ │
│ █ │ │
│ █ │ │
│ █ │ │
│ █ │ │
5000 ┤ █ │ │
│ █ │ │
│ █ │ │
│ █ └───┘
│ █
0┴───┴─────────────────
チャート3: 年別平均乗客数の推移
2019 2020 2021 2022
15000┬── █ ─────────────────────
│ █
│ █
│ █
│ █
12500┤ █
│ █ █ ──────
│ █ █ █
│ █ █ █
│ █ █ █
10000┤ █ █ █
│ █ █ █
│ █ █ █
│ █ █ █
│ █ ┌───┐ █ █
7500┤ █ │ │ █ █
│ █ │ │ █ █
│ █ │ │ █ █
│ █ │ │ █ █
│ █ │ │ █ █
5000┴───┴────┴───┴───┴───────┴
これらのチャートとともに、質問に対する回答は、神戸市営地下鉄の利用状況の特徴をよく捉えていると思います。平日の曜日別の乗客数、主要な駅の利用者数の違い、お盆休みの影響、そしてコロナ禍による変化など、データから読み取れる重要なポイントを説明しています。
報告書の読み込みもさせてみた
この記事が気に入ったらサポートをしてみませんか?