見出し画像

ChatGPT4 Code Interpreterで、近未来のデータアナリストを感じた

パーソナルなデータアナリスト


2023年7月7日OpenAIはChatGPT4 Code Interpreter(コードインタープリター)機能の一般開放を開始しました。これはChatGPT内で、コードの生成や理解、データ分析、グラフ生成、ファイル編集、Pythonコード実行などを行えるものです。

つまり、今までデータアナリスト(データサイエンティスト)が行なっていたテクニカルな業務の大部分をChatGPTがやってくれることになります!

データ分析プロジェクトでは、大きく分けて以下の三つの役割のメンバーがいます。「リサーチリード」が仮説を立て、「データアナリスト」がツールを操作して結果を出し、「プロデューサー」が現場に浸透させていきます。

データ分析プロジェクト3つの役割

今回リリースされたCode Interpreterは、まさにこの「データアナリスト」にあたります。この技術担当者であるデータアナリストが今後はChatGPT置き換わる未来もそう遠くないかもしれません。

Code Interpreterでデータ分析してみた


サンプルデータで顧客データ分析してみました。ある製品の購買履歴データで顧客属性と購入した/しないの結果データから構成されます。

最初のデータが1万件あるので、最初の5行を表示してくれます。


データ数や各変数の型、タイプ、欠損値など簡単な統計情報を提示してくれます。


可視化もしてくれます。日本語のラベル名が文字化けしてますね。多分チャートツールのエンコードの問題だと思います。


ヒストグラムや箱ヒゲ図、その他主要なチャートはサポートされているようでした。

さあ、ここから分析を行なってもらいます!

ロジスティック回帰モデルを薦められたので、行なってもらいます。それぞれの回帰係数を見て判断します。


決定木モデルでも行なってもらいます。それぞれの精度、プレシジョンやリコールも表示されます。多分、それぞれの意味も聞けば説明してくれると思います。


ディープラーニングでもやってもらいましたが、こちらはTensorFlowが使えないとのことでエラーになりました。この辺りは今後の課題ですね。


データの前処理もやってもらいました。これは便利そう。ここでは年収の連続値をカテゴリー値に変える処理をお願いしました。

まとめ

メリット1:対話型でデータ分析できる!


やはり素晴らしいのは本当にデータアナリストと話すように分析プロセスを進められる点でしょう。もちろん言っていることの真偽は確かめなくてはなりませんが、それは生身のデータアナリストも同じこと。リサーチリードにとっては、素早く自分の仮説を試せるのはとても重宝すると思います。

メリット2:データの可視化や前処理など労働集約的な業務を激減!


データ分析プロジェクトでは、たくさんのグラフ作成やデータ前処理(欠損値補完やデータ変換など)がデータアナリスト業務の多くを使ってしまいますが、これらから解放されて本来の分析業務に集中できそうな将来性を感じました。

逆に課題としては以下です。

課題1:サポートされてないアルゴリズム、モデルやデータの共有!


上記で「ディープラーニングはできない」と断られたように計算処理が重いアルゴリズム、また大規模な行列などのビッグデータ処理には向かないかもしれません。また特に企業で使用する場合にはセキュリティの懸念も残ります。(企業独自のAI開発のニーズがますます高まると思います)

課題2:小さく叩けば小さく響き、大きく叩けば大きく響く(=分析知識は重要)!


誰でもデータ分析を行うのはKSKアナリティクスのビジョンでもあるのですが、逆に言うと統計学や機械学習の知識や構造理解がなければ、使いこなせないものでもあります。その意味でデータ分析教育は、今後ますます重要になると思います!

オススメ:RapidMinerとの併用


ChatGPT Code Interpreterは対話的で優しい反面、機能やセキュリティ面での不安があります。RapidMinerはローコードの機械学習プラットフォームです。フリー版があり機械学習の専門ツールのため、データ分析プロジェクトに必要な機能が一通り揃っています。ChatGPTと併用することで、強力な分析プラットフォームになると思います。当社でも今後のソリューションについて考えてみたいと思います。

RapidMinerで同様の分析をやってみた例:

様々なチャートから選べるので。切り替えや使いやすさはなどはRapidMinerの方が便利


左下からアルゴリズムを選んでドラッグ&ドロップして作っていく。


決定技のサンプル、これはUIの好みや慣れもあると思うので、各人で異なるかな

この記事が気に入ったらサポートをしてみませんか?