見出し画像

ChatGPTを使ってざっくり集計できるか?

今回も突如思いついたChatGPTネタです。今回はどの会社もちょっと流行ったことがあるであろう集計「業種別売上高」の集計をChatGPTを使ってやってみた話です。

業種別売上高は大事な情報

「業種別売上高」

自分の会社の製品やサービスをどういうタイプの会社が購入してくれているのか?マーケティングとまで行かなくても営業をしているBtoBの会社であれば必ずと言っていいほど重要な統計情報です。BtoCの会社なら「年代別」とか「男女別」と同じくらい重要な情報です。

企業はその結果を見て、ターゲットはどういう業種の企業にすべきなのか?どういう点がその業種のビジネスにマッチしているのか?そして、どういったセールストークをするべきなのか?パンフレットに載せる顧客企業はどこがいいのか?・・・・などなど営業活動、マーケティング活動の方向性を決める重要な情報なのです。

業種別売上高の集計は面倒くさいし報われない

しかしながら、業種別売上高を集計するのはとても面倒くさくてコストが掛かります。なぜなら取引データにある顧客企業ごとに業種のコードを付けていかないといけないからです。

方法はざっくり三種類です

集計担当者が根性でコードを付加する
顧客の数や出入りがそんなに無いのであれば集計をする担当者が自ら、根性と労働時間を費やして、ひとつひとつ付加して行くというやり方です。このやり方は自分さえ努力すれば出来ますが、気がつけばコードが付いていない新規顧客が増えていたりして、いつまでも気が抜けません。

営業担当者にコードを付加してもらう
あと考えられるのが実際に取引情報を入力する営業担当者にお願いして業種コードを付けてもらう方法です。しかしながらこの方法は苦労をする営業担当者にはなんのメリットもないので、テキトーに間違ったコードつけられてしまい。その修正に追われながら「自分でやればよかった」と思うのです。

金を出してデータを手に入れる
次の方法は⚫⚫データバンク、とか⬛⬛商工リサーチみたいなところからデータを買ってきて、取引データと照合して業種別データを手に入れる方法です。この方法はなんといってもお金がかかります。しかも微妙にマッチしないことがあるのでその修正に追われます。結局残業して「こんなお金使うんじゃなかった」と自らの行動を悔やむのです。

どちらにせよ大事なことは「業種別売上」は大事だけどそんなに使わないのです。こんなもの毎日、毎週、毎月見たってそんなに変わらないのです。せいぜい半年や1年周期くらいで見れば充分なのです。そして見た結果は「ふーん」くらいなのです。

必要だけど努力は報われない

それが「業種別売上」なのです。

そこで生成AIの登場

そこで登場するのはChatGPTの登場です。この汎用性の高いAIによって、あのめんどうくさい「業種コード」つけを作業をすっ飛ばして、取引データーから直接「業種別売上」の集計をしてしまおうと考えてみたのです。

「生成AIは嘘をつくから信用できない」

そう思う人もいるかも知れませんが、そんなに自分の判断が正しいのか?そんなに営業担当の判断が正確なのか?・・・・そう考えたらたいして変わらないはずなのです。

というわけで試してみました。

サンプルデータ

サンプルとして準備したデータはGoogleで適当に調べた製鉄、化学、製薬、通信、電機の各会社の情報にテキトーに取引額を追加したデータです。「日本製鐵」とか「住友化学」のように会社名で業種が想像できる企業名もある反面、「第一三共」とか「Zホールディング」など全く想像できない企業名もあります。

さっそくプロンプトを考えて投入しました。
業種の区分についてはあえて何も指定しませんでした。

投入したプロンプト

集計結果の比較

「業種別売上高」はざっくり業種分布や傾向を見るものなので、あえてグラフで表現して比較することにしました。

手で集計した結果
元々業種別に検索して抽出した会社名だったので、そのとおりに業種を付加して集計してみました。

手で集計した結果


ChatGPTの集計結果
ChatGPTも自信が無いようで「仮定に基づいてグループ化された売上高」と断っていました。

ChatGPTの結果

結果的には手で集計(正解)とChatGPTに大きな差が出てしまいました。これでは使えないと感じましたが、原因があるはずです。まずは調査してみます。

差異の原因を調査したら・・・

調査方法は単純です。
一気に集計するのではなく、元のCSVに業種列を付加してもらいました。

プロンプトはこんな感じです。

投入したプロンプト

回答が出ました。ざっと見るとだいたい合っています。

出力された回答

実は間違いは一箇所だけでした。製鉄業の「新日本電工」さんの業種が「製鉄」ではなく「化学工業」に、「花王レゾナック」さんが「化学工業」ではなく「製薬」になっていました。きっと間違うと思って大きな金額にしていたのでグラフが大きく変化したのです。

「新日本電工」さんの業種が「製鉄」ではなく「化学工業」になっていた

これを修正して再集計した結果を出しました。

業種の順序がわかりにくいので整理してみます

製鉄 (正)30%:(GPT)30%
化学 0.7%:0,4%
製薬 20.5%:20.8%
通信 19.6%:19.6%
電機 29.2%:29.2%

傾向を掴むには充分な正確さになりました。

近未来(というか真面目にやったら)を想像

この適当な検証でも相当に正しい結果を得ることが出来ました。今回は業種を丸投げで決めてもらいましたが、⚫⚫データバンクとか⬛⬛商工リサーチのデータを学習させたり、きちんと指定したりすれば、もっと正確な情報を得られる気がします。

少なくともすごく工数をかけたり莫大なお金をかけなくても、簡単に答えは得られそうです。むしろ⚫⚫データバンク、とか⬛⬛商工リサーチがそんなサービスしてくれてもいい気がします。顧客名が載った取引データをアップロード業種別に集計して返してくれるとか・・・・

かなり期待です



この記事が気に入ったらサポートをしてみませんか?