データ分析機能を検証してみた|GPT-4のModel: Code Interpreter
世の中がMETA社のThreadsで盛り上がっている中、静かに進化を遂げたChatGPT。はっきり言ってグーの音も出ないほど有能である。
フロントエンドエンジニアである筆者は手始めに画像処理についての検証を行った。これについては以下の別ページ参照の事。
Code Interpreterのデータ分析機能
CSVやExcelなどのデータファイルをアップロードすれば、ChatGPTはそのデータを読み込んで分析を行うことができる。これはGPT-4のプラグイン、Noteable同等の機能だが、よりスマートにより体感的になったと思う。
筆者はwebフロントエンドエンジニア・デザイナーのメンターをする傍ら、Airbnbホスト業も合わせて行っている。
今回はAirbnbホストとして管理している2つのリスティング、2021年、2022年、2023年のデータCSVをアップしてModel: Code Interpreterに解析してもらった。
パターンを探すための初期のデータ分析プロセス
まず手始めに1月〜6月の収益の推移を2021年、2022年、2023年のCSVから折れ線グラフ蘇三本色分けして縦軸売上横軸月で表してもらった。アップできるファイルは1つづつ。チャット欄の左の+マークをクリックすると、「Upload file」と表示されるのでPCにある該当ファイルを選ぶ。
コロナ禍の収益を今年の収益と比べてみる
特に2021年は4月に大きな落ち込みを確認できた。
そこで稼1月から6月までの働率を調べてもらった。
コロナ禍の稼働率を今年の稼働率と比べてみる
するとやはり2021年の4月の稼働率が落ち込んでいる事がわかる。
ただ、収益では跳ね上がっていた今年の4月の稼働率は下がるどころかむしろ上がっていた。そこでこれは長期滞在者に適応している1ヶ月以上の滞在に適応される30%割引が影響していると思い、述べ人数も調べてもらった。
コロナ禍ののべ宿泊人数を今年ののべ宿泊人数と比べてみる
すると2021年の4月に落ち込んでいた収益及び宿泊日数は5月ののべ宿泊人数2人と言う結果でわかるように、2部屋とも長期滞在者が宿泊しており、また支払いはチェックイン日に支払われることから落ち込んでいた事がわかった。
コロナ禍はあまり関係ない?
今年の4月5月の爆発的な伸びはやはりインバウンド復活が大いに影響していると言える。ただ、のべ宿泊者人数で言えばそんなに変化がない。そこでこれは、円安の影響での収益格差であると判断できる。
国の統計もModel: Code Interpreterに解析してもらった
使用した資料はここからダウンロードできるエクセルファイルだ。
データは2022年と2021年しかアップされていないため、コロナ禍とインバウンド回復後を比べる事はできないが、解析データによると都内の宿泊日数はどの月もまるで変わらない事がわかる。
ハルシネーション問題は依然として解決されていない
ただここで問題なのは、データはPythonを使って正しく出してくれるものの、データの解説がいただけない。ユーザーの予測を考慮して発言をしてくる。以下にGPT-4の感想を載せておく。
GTP-4所感:
データを見ればわかるように、都内はどの月も一様に宿泊日数があり月によって閑散期などない事がわかる。観光目的ではない宿泊客がメインである事が予想つく。それにもかかわらず、このような所感を述べるとは。
下記のようなフィードバックを入力しておいた。
この記事が気に入ったらサポートをしてみませんか?