見出し画像

データ分析機能を検証してみた|GPT-4のModel: Code Interpreter

世の中がMETA社のThreadsで盛り上がっている中、静かに進化を遂げたChatGPT。はっきり言ってグーの音も出ないほど有能である。

フロントエンドエンジニアである筆者は手始めに画像処理についての検証を行った。これについては以下の別ページ参照の事。

Code Interpreterのデータ分析機能

CSVやExcelなどのデータファイルをアップロードすれば、ChatGPTはそのデータを読み込んで分析を行うことができる。これはGPT-4のプラグイン、Noteable同等の機能だが、よりスマートにより体感的になったと思う。

筆者はwebフロントエンドエンジニア・デザイナーのメンターをする傍ら、Airbnbホスト業も合わせて行っている。

今回はAirbnbホストとして管理している2つのリスティング、2021年、2022年、2023年のデータCSVをアップしてModel: Code Interpreterに解析してもらった。

パターンを探すための初期のデータ分析プロセス

まず手始めに1月〜6月の収益の推移を2021年、2022年、2023年のCSVから折れ線グラフ蘇三本色分けして縦軸売上横軸月で表してもらった。アップできるファイルは1つづつ。チャット欄の左の+マークをクリックすると、「Upload file」と表示されるのでPCにある該当ファイルを選ぶ。

コロナ禍の収益を今年の収益と比べてみる

特に2021年は4月に大きな落ち込みを確認できた。

そこで稼1月から6月までの働率を調べてもらった。

コロナ禍の稼働率を今年の稼働率と比べてみる

するとやはり2021年の4月の稼働率が落ち込んでいる事がわかる。

ただ、収益では跳ね上がっていた今年の4月の稼働率は下がるどころかむしろ上がっていた。そこでこれは長期滞在者に適応している1ヶ月以上の滞在に適応される30%割引が影響していると思い、述べ人数も調べてもらった。

コロナ禍ののべ宿泊人数を今年ののべ宿泊人数と比べてみる

すると2021年の4月に落ち込んでいた収益及び宿泊日数は5月ののべ宿泊人数2人と言う結果でわかるように、2部屋とも長期滞在者が宿泊しており、また支払いはチェックイン日に支払われることから落ち込んでいた事がわかった。

コロナ禍はあまり関係ない?

今年の4月5月の爆発的な伸びはやはりインバウンド復活が大いに影響していると言える。ただ、のべ宿泊者人数で言えばそんなに変化がない。そこでこれは、円安の影響での収益格差であると判断できる。

国の統計もModel: Code Interpreterに解析してもらった

使用した資料はここからダウンロードできるエクセルファイルだ。

データは2022年と2021年しかアップされていないため、コロナ禍とインバウンド回復後を比べる事はできないが、解析データによると都内の宿泊日数はどの月もまるで変わらない事がわかる。

ハルシネーション問題は依然として解決されていない

ただここで問題なのは、データはPythonを使って正しく出してくれるものの、データの解説がいただけない。ユーザーの予測を考慮して発言をしてくる。以下にGPT-4の感想を載せておく。

GTP-4所感:

以上のグラフは、2021年と2022年の1月から6月までの東京都内の全宿泊施設での宿泊日数の合計を表しています。2021年と2022年を比較すると、全体的なトレンドは似ていますが、2022年の1月と2月の宿泊日数が大幅に減少していることが見て取れます。

これらのデータをAirbnbの収益データと比較すると、一部の月ではホテルの宿泊日数の減少とAirbnbの収益の増加というパターンが見られます。これは、旅行者がホテルではなくAirbnbの宿泊施設を選択した可能性を示しています。

データを見ればわかるように、都内はどの月も一様に宿泊日数があり月によって閑散期などない事がわかる。観光目的ではない宿泊客がメインである事が予想つく。それにもかかわらず、このような所感を述べるとは。

下記のようなフィードバックを入力しておいた。

Model: Code Interpreterの機能を堪能しています。 愛用してきたNoteableプラグインよりもより、指示を自然言語のみでお願いしてもユーザーの言わんとすることを察してpythonにしてくれるのでものすごい便利です。ただ、自分の解析して出してきたグラフの評価でハルシネーションを起こしてしまいます。ユーザーの予測に沿った解析結果を答えてくれちゃいます。

筆者


この記事が気に入ったらサポートをしてみませんか?