AI時代の「データアナリスト」の役割とはなんだろう
フルスタックマーケティング株式会社・代表取締役の清水です。
ここ最近は仕事でバタバタしていたのですっかりSNSから遠ざかっていましたが、改めてちゃんと頭の整理と発信の習慣をつけようということで、noteを再開します。
品質を担保しようとするとハードルが上がりすぎて筆が進まないので、まずは拙くても最低で1週間に1投稿することを目標にやっていきます!
生成AIがデータ分析に及ぼしつつある影響
「前処理」工程では、既に人間を代替しつつある
以前noteでも書きましたが、生成AI(特にChatGPT)の登場によって、Pythonを使わないと難しいような高度なデータ分析も、自然言語をベースに簡単にできるようになりました。
特に「前処理」と呼ばれる分析データの変換作業については、自然言語との相性の良さもあって、急速に人間を代替していくでしょう。
例えば、以下のような電話番号の文字列があったときに
070-2613-3416
090-8094-3930
070-7149-0930
090-3969-7807
090-3047-5587
070-2014-0803
090-5412-3486
070-6985-7585
080-0564-6600
090-3307-3540
この「-」を削除する、みたいな作業を、これまではデータアナリストやらがPythonでコードを書いたり、Excelで関数を書いたりして処理していたのです。
こういうのは、ChatGPTだと自然言語で簡単に依頼できます。
他にも「文字列の先頭に国番号を付与してほしい」とか「070/080/090の3グループに分類してほしい」みたいな処理も、もちろん可能です。
そんなわけで、こういうシンプルなルールにもとづいた前処理に関しては、生成AIの有用性は誰が見ても明らかです。
人間の作業は代替され、仕事としての「前処理」の重要性は著しく低下することは間違いありません。
「探索的データ分析(EDA)」でも、近々、人間を代替していく
前処理したデータセットについて特徴を見極めたり、異常値を検出したり、分布を把握したり、といった作業を通じて、データセットの理解を深める工程のことを「探索的データ分析(EDA)」といいます。
この工程は、従来はPythonの実行環境上(Jupyter NotebookやGoogle Colaboratory)や、ExcelやGoogleスプレッドシートなどの表計算ソフト上、はたまたデータセットをインポートしたBI上で行なうことが多かったものです。
しかし、生成AIが登場してからというもの、ITベンダーたちが次々と、より直感的なEDAができるツールを発表し始めています。
特にインパクトが大きかったのは、Googleが発表した、Google BigQueryと接続できる「データキャンバス」でしょう。
Google BigQueryとシームレスに接続された「データキャンバス」上で、スキーマの閲覧やクエリの作成、データテーブルの表示、そしてグラフの生成までが自由度の高いGUI上で行なえるのは、本当に便利です。
しかも、これらの操作がすべて自然言語で行えるようになっていきます。
これまでもRedashのような、DWHとBIの機能を併せ持つツールは存在していましたが、やはりUIに応じた機能的制約を受けることと、SQLクエリを習得しなければならないことが、普及の大きなハードルとなっていました。
これらのハードルがいずれも解消されうるのが、Googleの「データキャンバス」というソリューションです。
また、似たような思想のサードパーティツールとして「Count」「Morph」などのサービスもあり、この分野は今後の発展が著しいでしょう。
そんなわけで、「探索的データ分析(EDA)」の工程においても、AIの活躍と人的作業の代替は進んでいくと思われます。
生成AIは、HOWは得意だがWHATが苦手
ただ、僕が生成AIをいろんな分野で使ってみて気づいた「生成AIができないこと」がひとつあります。
それは、「生成AIはHOW(手法)には長じているが、一方で、WHAT(コンセプトやメッセージ)を意図することができない」というものです。
最近は画像生成AIもよく触るのですが、AIで作った画像には「ナラティブ(一貫性のある意図)」が存在しません。
なぜなら、AIは無数の情報ソースの中から要素を組み合わせて、確率論的にアウトプットを生成しているに過ぎず、それは言い換えると「寄せ集めの材料で作ったハリボテを生み出している」ということだからです。
たしかに、生成AIが生み出したアウトプットというのは、一見すると「確からしそう」「なんかよさそう」ではあるのですが、じゃあそれをどうやって使おう?となると困ってしまうことが多くありません。
生成AIには「意図」がないので、こちらが想定している文脈に配置してみたときに、どうしても拭いきれない違和感が生じてしまうからです。
同様に、データ分析においても「HOW(手法)には長じているが、一方で、WHAT(コンセプトやメッセージ)を意図することができない」という特徴が、生成AIの限界を規定しています。
自社の売上データを参照して「売上の高い商品はどれ?」と聞けば、生成AIは的確な答えを返してくれるでしょう。
しかし、「今後、自社の売上を伸ばしていくうえで注力すべき商品カテゴリはどれ?」と聞いたときに、満足する答えが返ってくるとは思えません。
それは、「自社の売上を伸ばしていくうえで注力すべき商品カテゴリ」を考えるためには、前提として「ナラティブ(一貫性のある意図)」が必要だからです。
生成AIは、人間的活動をエンパワーメントするが、非人間的活動をディスラプトしていく
ここまでの内容をまとめると、以下のとおりです。
前処理や探索的データ分析(EDA)は、生成AIによって効率化される
生成AIはナラティブ(一貫性のある意図)を持たないため、HOWに長じている一方でWHATを意図することができない
したがって、確かに前処理や探索的データ分析(EDA)は効率化されうるのですが、それはあくまでも「WHATを意図することができる人間の存在があっての話」ということになります。
いろいろなところで言われている話ですが、仮説を立てたり、課題を設定したりすることは、生成AIにはまだできません。
このようなタスクも「AGI(汎用人工知能)」であれば実現可能だと言われていますが、その開発にはまだ時間がかかりそうです。
仮にAGIが開発されたとしても、AGIと対話・議論しながら考えを深めていける人間がいなければ、AGIが有効活用されることはありません。
どれだけAIが進化しても、「WHATを意図することができる人間の存在」は必要です。
まとめると、AIは「WHATを意図するような人間的活動」をエンパワーメントしていきます。一方で、「HOWに長じるような非人間的活動」をディスラプトしていくでしょう。
したがって、AI時代のデータアナリストの役割とは、「WHATを意図するような人間的活動」を通じて、より効果的なデータ分析の要件定義や設計、そして分析結果のプレゼンテーションを行なうことだと言えます。
HOWにのみ長じたデータアナリストは、どのようにして駆逐されていくのか?
では、「WHATを意図するような人間的活動」ができない、HOWにのみ長じたようなデータアナリストは、どのようにして駆逐されていくのでしょうか。
僕は、AI活用の最も優れた点は「高速でフィードバックループが回ること」だと考えており、このポイントをおさえてAIを活用する非データアナリストたちが、データアナリストの仕事を奪っていくと考えています。
わかりやすく、生成AIでイラストを描くことを例に説明します。
従来、イラストに熟達するためには、自分でイラストを描いて、その結果からフィードバックを得て描き方を修正をする、という工程を繰り返す必要がありました。
しかし、生成AIが登場したことによって、自分でイラストを描かなくても、生成AIにイラストを生成してもらえば、その結果からフィードバックを得ることができ、それに応じてプロンプトを修正することで、イラストに熟達することができるようになりました。
従来の手法だと、1枚の絵を描くのに1時間かかっていたところが、わずか1分で1枚の絵を描くことができるようになったわけです。
もちろん、自分で描いてみるよりは学習効果は低いでしょうが、大切なのは「高速でフィードバックループが回ること」です。これにより、1回あたりの学習効果は低いものの、回数を重ねることで高い学習効果を実現できます。
同じことがデータ分析の世界でも言えます。
従来はSQLを書いてデータを抽出し、データを見ながら前処理をし、BIでEDAをして、プレゼンテーションにまとめて… といったことをすべて人間がやらなくてはなりませんでした。
しかし、自然言語ベースでこれらのタスクを実行できるようになり、従来は1日かかっていたタスクが1時間で完了できるようになると、「高速でフィードバックループが回る」ようになります。
結果として、HOWの熟達スピードが段違いに早くなるため、非データアナリストがすぐにデータ分析を実践できるようになります。
特にクリエイティブな領域(Webデザインなど)でない限り、HOWのレベルの差は、大きなアウトカムの差を生み出しません。
したがって、HOWにのみ長じたデータアナリストは、高速でHOWに熟達してしまう非データアナリストに駆逐されてしまうのです。
改めて、AI時代のデータアナリストは、「WHATを意図するような人間的活動」を通じて、より効果的なデータ分析の要件定義や設計、そして分析結果のプレゼンテーションを行なっていくことで、その価値を高めていくしかありません。
おわりに
弊社では、フルスタックなマーケティング支援事業を行なっております。
私に興味を持ってくださった方がいらっしゃいましたら、お気軽にお問い合わせください。
Xアカウントはこちら。
https://twitter.com/fsm_shimizu
この記事が気に入ったらサポートをしてみませんか?