ChatGPTの新データ分析機能がすごい！

2024年5月25日 03:53

先頃、ChatGPTのアップデートで新モデルのGPT-4oが導入されました。これと併せて、データ分析機能が大幅に改善されました。そこで、今回は、この新しいデータ分析機能について解説します。

１．Google Driveなどからファイル追加

新しいデータ分析機能は、現在のところ、有料ユーザーのみが利用可能であり、GPT-4oモデルを選択することで使用することができます。

ChatGPTの操作画面の入力欄の左のクリップのマークをクリックすると、以下のようにGoogle DriveやMicrosoft OneDriveからファイルを追加することができます。

この機能を使用するには、最初に「アプリを接続する」を選択し、画面の指示に従って、Google Driveなどのアプリを接続してください。
以下のように、「設定」の「接続するアプリ」タブからアプリを接続したり、切断したりすることもできます。

アプリの接続後にChatGPTの操作画面に戻って、クリップマークをクリックし、「Google Driveから追加する」をクリックすると、以下の画面が現れ、ファイルを選択して、ChatGPTに追加できるようになります。

以下がGoogle Driveからstrabucks.csvのファイルを追加したところです。

○都道府県別のスターバックス店舗数のデータファイル

２．インタラクティブな表の操作

(1) インタラクティブな表の表示

starbucks.csvのファイルを追加して、そのまま矢印をクリックして送信します。すると以下のように英語で回答が返ってきます。上の表がインタラクティブな表になっており、右上のマークは「Google Driveで開く」「tableをダウンロードする」「tableを広げる」を表しています。

右上の「tableを広げる」をクリックすると、以下のように表が拡大表示されます。

(2) インタラクティブな表の一部についての質問

以下のように表の一部を選択して質問することができます。

上の図のように１行目をマウスで選択すると、以下のように「行 #1」と青字で表示され、この部分について質問ができます。

回答は以下の通り。

次は、５行目までを選択します。

(3) インタラクティブな表の編集

表のデータを並べ替えることもできます。
① プロンプト：降順にして

② プロンプト：八地方区分ごとに集計して

③ プロンプト：百分率で表して

④ プロンプト：店舗数を倍にして

表の右上のマークをクリックして、表を拡大表示しました。

３．インタラクティブなグラフの作成

インタラクティブなグラフが作成できるグラフの種類は、棒グラフ、折れ線グラフ（ラインプロット）、円グラフ、散布図の４種類です。

(1) 棒グラフ

右上のマークは、「静的チャートに切り換える」「グラフの色の変更」「chartをダウンロードする」「chartを広げる」を表しています。マウスでグラフに触れると、ポップアップで数値が表示されます。以下のようにデータセットの色を選んで変更することもできます。

(2) 折れ線グラフ（ラインプロット）

マウスでグラフに触れると、ポップアップで数値が表示されます。以下のようにデータセットの色を選んで変更することもできます。

(3) 円グラフ

マウスでグラフに触れると、ポップアップで数値が表示されます。以下のように各データ項目の色を選んで変更することもできます。

(4) 散布図

マウスでグラフに触れると、ポップアップで数値が表示されます。以下のようにデータセットの色を選んで変更することもできます。

(5) その他のグラフ

インタラクティブなグラフではありませんが、その他にも様々なグラフを描くことができます。以下にいくつかの例を紹介します。

① ヒストグラム

② 箱ひげ図

③ 3Dグラフ（3Dサーフェスプロット）

４．データの分析

(1) スターバックス店舗数の分析

ファイルのみをそのまま送信すると、ChatGPTが英語で回答してくるので、「日本語で分析して」と指示します。

グラフを描いて、視覚化してもらいます。

最後に、データ分析から得られるインサイト（洞察）を抽出します。

(2) スターバックスの店舗数と都道府県の人口の相関分析

スターバックスの店舗数のファイルと都道府県の人口に関するファイルを同時に分析してもらいます。

○都道府県別のスターバックス店舗数のデータファイル

○都道府県の人口に関するデータファイル

ChatGPTが2つのファイルのデータを結合した表を作成しましたが、北海道だけしか記載されていません。これは、都道府県の人口に関するデータファイルの都道府県名の「都」「府」「県」の文字が省略されているためだと考えられます。したがって、都道府県名を修正して、再結合することを指示します。

プロンプト：population.csvの都道府県名を正しく修正して、データの結合をやり直してください。

今度は、データを正しく結合することができました。表を拡大表示すると、以下のようになります。

グラフを描いて視覚化してもらいます。

グラフが文字化けしてしまいました。インタラクティブなグラフは最初から日本語表示に対応していますが、インタラクティブでないグラフは日本語表示が上手くいきません。
日本語フォントファイルをアップロードして、グラフを描き直してもらいます。

○日本語フォントファイル（NotoSansJPのTrueTypeフォント）

一部、日本語表示が修正されましたが、都道府県名は正しく表示されません。
表示がおかしいだけで、ChatGPTは都道府県を正しく認識しているはずだと考えて、このまま分析を進めます。

最後に、今回の分析から得られたインサイトをまとめてもらいます。

(3) ポケモンデータの分析

900匹以上のポケモンのステータスなどについてまとめたデータファイルを分析します。

○ポケモンのステータスデータ

あなた
日本語で分析して
ChatGPT
データセットが正しく読み込まれました。このポケモンのステータスデータには、以下のカラムが含まれています：
１．図鑑番号 (図鑑番号)
２．ポケモン名 (ポケモン名)
３．タイプ１ (タイプ1)
４．タイプ２ (タイプ2)
５．通常特性１ (通常特性1)
６．通常特性２ (通常特性2)
７．夢特性 (夢特性)
８．HP
９．こうげき (攻撃)
10．ぼうぎょ (防御)
11．とくこう (特攻)
12．とくぼう (特防)
13．すばやさ (素早さ)
14．合計 (合計)
次にどのような分析を行いたいですか？例えば、特定のポケモンのステータスの比較や、タイプごとの分布など、具体的な分析の要望を教えてください。

あなた
タイプごとのステータスの特徴について分析して
ChatGPT

タイプごとの平均ステータスを分析すると、以下の特徴が見られます：
１．HP（ヒットポイント）
最も高い平均HPを持つタイプは「ドラゴン」（85.1）。
最も低い平均HPを持つタイプは「むし」（57.5）。
２．こうげき（攻撃）
最も高い平均攻撃を持つタイプは「ドラゴン」（108.6）。
最も低い平均攻撃を持つタイプは「フェアリー」（61.2）。
３．ぼうぎょ（防御）
最も高い平均防御を持つタイプは「はがね」（125.2）。
最も低い平均防御を持つタイプは「ノーマル」（60.5）。
４．とくこう（特攻）
最も高い平均特攻を持つタイプは「エスパー」（98.0）。
最も低い平均特攻を持つタイプは「むし」（56.6）。
５．とくぼう（特防）
最も高い平均特防を持つタイプは「フェアリー」（88.3）。
最も低い平均特防を持つタイプは「かくとう」（64.9）。
６．すばやさ（素早さ）
最も高い平均素早さを持つタイプは「ドラゴン」（106.2）。
最も低い平均素早さを持つタイプは「フェアリー」（53.6）。
７．合計
最も高い平均合計ステータスを持つタイプは「ドラゴン」（544.1）。
最も低い平均合計ステータスを持つタイプは「むし」（386.3）。

これらの統計から、タイプごとのポケモンの特徴が浮かび上がります。ドラゴンタイプは全体的に高いステータスを持ち、特に攻撃と素早さが際立っています。一方、むしタイプは全体的にステータスが低めです。はがねタイプは防御が非常に高く、フェアリータイプは特防が高いことがわかります。

あなた
視覚化して
ChatGPT

タイプごとのステータスの平均値を棒グラフとしてまとめました。このグラフでは、各タイプごとのHP、攻撃、防御、特攻、特防、素早さ、および合計の平均値が一目で分かります。
このグラフから、各タイプの特徴がさらに明確に把握できると思います。他に分析したい内容や、他の種類のグラフについての要望があれば教えてください。

あなた
ランキング6位までのポケモンを比較して
ChatGPT

トップ6のポケモンのステータスを比較した棒グラフを作成しました。このグラフでは、各ポケモンのHP、攻撃、防御、特攻、特防、素早さのステータスを比較しています。
各ポケモンのステータスが一目で分かるようになっており、どのポケモンがどのステータスで優れているかを視覚的に把握することができます。他に分析したい内容や追加の要望があれば教えてください。

(4) 売上データの分析

売上のサンプルデータについて、グラフを描いて分析します。

○売上のサンプルデータ

あなた
月ごとの総売上の変動、カテゴリごとの売上の比率、店舗別の売上について分析して
ChatGPT

Monthly Sales Data
（表を省略）
Category Sales Ratio Data
（表を省略）
Store Sales Data
（表を省略）
データの分析結果は以下の通りです。
１．月ごとの総売上の変動：
グラフから、各月の総売上の推移が視覚化されており、月ごとの売上変動が確認できます。
２．カテゴリごとの売上の比率：
カテゴリごとの売上比率を円グラフで示しました。各カテゴリの売上が全体に占める割合が一目で分かります。
３．店舗別の売上：
店舗ごとの総売上を棒グラフで示しました。店舗別の売上の違いが明確に分かります。
必要に応じて、さらに詳細な分析や追加の情報提供が可能です。

あなた
インサイトを抽出して
ChatGPT
以下に、データ分析から得られる主要なインサイトを示します：
１．月ごとの売上変動：
売上のピークは特定の月に集中している可能性があります。例えば、年末年始やボーナスシーズンの影響で特定の月に売上が急増していることが考えられます。
一方で、売上が低迷している月もあり、これらの月に対するプロモーション活動やマーケティング戦略の再考が必要かもしれません。
２．カテゴリごとの売上比率：
主要カテゴリとして家電やファッションが大きな割合を占めていることがわかります。これらのカテゴリが店舗全体の売上に大きく貢献しているため、在庫管理や新製品の投入に注力することが重要です。
比較的売上の少ないカテゴリについても、成長の可能性を探るための市場調査や顧客ニーズの分析が有益です。
３．店舗別の売上：
大阪店舗が最も高い売上を上げており、他の店舗と比較して顕著な差があります。大阪店舗の成功要因を他店舗にも適用することで、全体の売上を向上させる可能性があります。
名古屋や東京店舗も一定の売上を維持していますが、福岡店舗と比較すると若干低めです。地域特性や顧客の嗜好に応じたカスタマイズされたアプローチが必要です。

行動提案
売上の低迷月への対策：プロモーションやキャンペーンを強化し、顧客の購買意欲を喚起する施策を導入。
人気カテゴリの強化：家電やファッションカテゴリの商品ラインナップを拡充し、顧客のニーズに応える。
低売上カテゴリのテコ入れ：市場調査を行い、需要がある製品を見極めて商品戦略を再構築。
店舗ごとの戦略：大阪店舗の成功事例を分析し、他店舗への展開を検討。特に名古屋や東京の売上向上策を実施。

このようなインサイトと行動提案を基に、具体的なマーケティング戦略や運営方針を策定することで、全体の売上向上が期待できます。

(5) 教育用標準データセット（SSDSE）の分析

統計センターがデータ分析の教育用に公開している教育用標準データセット（SSDSE）を使用してデータ分析を行います。
SSDSEの2024年版基本素材（SSDSE-E）は以下のリンクから入手できます。
○SSDSE-E-2024（CSV：28KB）

あなた
日本語で、都道府県別の医療充実度を比較・分析して
ChatGPT
データセットの構造が確認できました。このデータには、各都道府県の総人口、出生数、医療関連の数値（医師数、歯科医師数、薬剤師数など）が含まれています。このデータを使って、都道府県別の医療充実度を比較・分析します。
以下の手順で分析を進めます。
１．医療関連のデータを抽出。
２．都道府県ごとの医療充実度を評価する指標を作成。
３．指標に基づいて都道府県を比較・分析。
まず、必要な医療関連データを抽出します。医師数（I5103列）、歯科医師数（I6200列）、薬剤師数（I6300列）を使って分析を行います。次に、これらの値を基に医療充実度の指標を作成し、都道府県ごとに比較します。
では、医療関連のデータを抽出します。

医療関連データを抽出しましたが、初期データには「全国」やヘッダー行が含まれているため、これらを削除してクリーンなデータにします。その上で、各都道府県の医療充実度を評価する指標を作成し、比較・分析を行います。
次に、以下の手順で進めます。
１．不要な行を削除。
２．数値データを整数型に変換。
３．医療充実度の指標（例えば、人口あたりの医師数、歯科医師数、薬剤師数）を計算。
まず、不必要な行を削除し、数値データを適切に変換します。
Cleaned Medical Data By Prefecture
（表を省略）
次に、各都道府県の人口データを基に医療充実度の指標を作成し、都道府県ごとに比較・分析します。具体的には、以下の指標を計算します：
・人口1万人あたりの医師数
・人口1万人あたりの歯科医師数
・人口1万人あたりの薬剤師数
これにより、各都道府県の医療リソースの充実度を評価します。
まず、人口データを抽出し、各指標を計算します。
人口データに非数値データ（ヘッダー行など）が含まれているため、数値変換が失敗しています。非数値データを取り除き、再度変換を試みます。
以下の手順を実行します：
１．非数値データを除去。
２．人口データを数値に変換。
３．医療データと人口データを結合し、指標を計算。
では、これらの手順を実行します。
Medical Resource Per 10,000 Population By Prefecture
（表を省略）
都道府県ごとの医療充実度の指標を計算し、以下の表に示しました。これにより、各都道府県の人口1万人あたりの医師数、歯科医師数、薬剤師数が分かります。
次に、これらの指標を用いて都道府県別の医療充実度を比較・分析します。
・人口1万人あたりの医師数
・人口1万人あたりの歯科医師数
・人口1万人あたりの薬剤師数
これらの指標を基に都道府県を比較し、どの地域がより医療リソースが充実しているかを可視化します。以下に、人口1万人あたりの医師数、歯科医師数、薬剤師数を都道府県ごとにプロットします。

上記のプロットにより、都道府県ごとの人口1万人あたりの医師数、歯科医師数、薬剤師数が視覚化されました。
これにより、どの都道府県がより医療リソースが充実しているかを比較することができます。具体的な数値とグラフを用いて、医療リソースの充実度についての傾向や特定の都道府県の特徴をさらに詳しく分析できます。例えば、人口1万人あたりの医師数が多い地域はどこか、薬剤師数が多い地域はどこかを視覚的に把握できます。
さらに具体的な分析や特定の都道府県の詳細な比較が必要な場合は、追加の指標や分析を行うことも可能です。その他に必要な分析や情報がありましたら教えてください。

表が細かくて見づらいので修正を指示します。

あなた
都道府県ごとの人口1万人あたりの医師数、歯科医師数、薬剤師数を一つのグラフで表示して
ChatGPT

都道府県ごとの人口1万人あたりの医師数、歯科医師数、薬剤師数を一つのグラフにまとめました。このグラフにより、各都道府県の医療リソースの充実度を比較することができます。
青色のバーは医師数、緑色のバーは歯科医師数、赤色のバーは薬剤師数を表しています。各都道府県ごとの医療リソースの相対的な比較が可能です。
他に分析したい内容や追加の質問があればお知らせください。

あなた
インサイトを抽出して
ChatGPT
このグラフからいくつかのインサイトを抽出できます：
医師の充実度
１．医師数が多い都道府県:
北海道、東京都、神奈川県、大阪府などは人口1万人あたりの医師数が多い。
特に東京都は医師数が顕著に多く、医療の充実度が高いことがわかります。
歯科医師の充実度
２．歯科医師数が多い都道府県:
同様に、東京都、神奈川県、大阪府などは人口1万人あたりの歯科医師数も多い。
歯科医師数に関しても都市部で充実している傾向が見られます。
薬剤師の充実度
３．薬剤師数が多い都道府県:
東京都、大阪府、福岡県などが薬剤師数で突出している。
薬剤師数も都市部で多く、医療提供体制が整っていることが示唆されます。
地域ごとの傾向
４．都市部 vs. 地方:
全体的に見ると、都市部（東京都、大阪府、神奈川県など）は医師、歯科医師、薬剤師のすべての指標で高い数値を示しています。
一方、地方（例えば、青森県、秋田県など）はこれらの指標が低く、医療リソースが不足している可能性があります。
総合的な医療充実度
５．総合評価:
医師、歯科医師、薬剤師のすべての指標で高い数値を示す東京都は、総合的な医療充実度が最も高いと評価できます。
都道府県間の医療リソースの格差が明確に見えるため、地方における医療リソースの強化が必要であることがわかります。
政策提言
６．医療リソースの分配:
都市部に集中している医療リソースを地方にも分配する政策が求められます。
地方での医療従事者の確保やインフラ整備が重要な課題です。
結論
７．まとめ:
医療リソースは都市部に集中しており、地方との差が大きいことが明らかになりました。
地方における医療充実度の向上が、今後の日本全体の医療提供体制の強化において重要です。

このようなインサイトを基に、さらなる詳細な分析や政策提言を行うことができます。他に具体的な質問や分析したい視点がありましたら、お知らせください。

この記事が気に入ったらサポートをしてみませんか？