見出し画像

AI時代の「データアナリスト」の役割とはなんだろう

フルスタックマーケティング株式会社・代表取締役の清水です。

ここ最近は仕事でバタバタしていたのですっかりSNSから遠ざかっていましたが、改めてちゃんと頭の整理と発信の習慣をつけようということで、noteを再開します。

品質を担保しようとするとハードルが上がりすぎて筆が進まないので、まずは拙くても最低で1週間に1投稿することを目標にやっていきます!

生成AIがデータ分析に及ぼしつつある影響

「前処理」工程では、既に人間を代替しつつある

以前noteでも書きましたが、生成AI(特にChatGPT)の登場によって、Pythonを使わないと難しいような高度なデータ分析も、自然言語をベースに簡単にできるようになりました。

特に「前処理」と呼ばれる分析データの変換作業については、自然言語との相性の良さもあって、急速に人間を代替していくでしょう。

例えば、以下のような電話番号の文字列があったときに

070-2613-3416
090-8094-3930
070-7149-0930
090-3969-7807
090-3047-5587
070-2014-0803
090-5412-3486
070-6985-7585
080-0564-6600
090-3307-3540

この「-」を削除する、みたいな作業を、これまではデータアナリストやらがPythonでコードを書いたり、Excelで関数を書いたりして処理していたのです。

こういうのは、ChatGPTだと自然言語で簡単に依頼できます。

ちなみに、ダミーの電話番号リストも生成AIが一瞬で生成してくれました

他にも「文字列の先頭に国番号を付与してほしい」とか「070/080/090の3グループに分類してほしい」みたいな処理も、もちろん可能です。

そんなわけで、こういうシンプルなルールにもとづいた前処理に関しては、生成AIの有用性は誰が見ても明らかです。
人間の作業は代替され、仕事としての「前処理」の重要性は著しく低下することは間違いありません。

「探索的データ分析(EDA)」でも、近々、人間を代替していく

前処理したデータセットについて特徴を見極めたり、異常値を検出したり、分布を把握したり、といった作業を通じて、データセットの理解を深める工程のことを「探索的データ分析(EDA)」といいます。

この工程は、従来はPythonの実行環境上(Jupyter NotebookやGoogle Colaboratory)や、ExcelやGoogleスプレッドシートなどの表計算ソフト上、はたまたデータセットをインポートしたBI上で行なうことが多かったものです。
しかし、生成AIが登場してからというもの、ITベンダーたちが次々と、より直感的なEDAができるツールを発表し始めています。

特にインパクトが大きかったのは、Googleが発表した、Google BigQueryと接続できる「データキャンバス」でしょう。

Google BigQueryとシームレスに接続された「データキャンバス」上で、スキーマの閲覧やクエリの作成、データテーブルの表示、そしてグラフの生成までが自由度の高いGUI上で行なえるのは、本当に便利です。
しかも、これらの操作がすべて自然言語で行えるようになっていきます。

これまでもRedashのような、DWHとBIの機能を併せ持つツールは存在していましたが、やはりUIに応じた機能的制約を受けることと、SQLクエリを習得しなければならないことが、普及の大きなハードルとなっていました。
これらのハードルがいずれも解消されうるのが、Googleの「データキャンバス」というソリューションです。

また、似たような思想のサードパーティツールとして「Count」「Morph」などのサービスもあり、この分野は今後の発展が著しいでしょう。

そんなわけで、「探索的データ分析(EDA)」の工程においても、AIの活躍と人的作業の代替は進んでいくと思われます。

生成AIは、HOWは得意だがWHATが苦手

ただ、僕が生成AIをいろんな分野で使ってみて気づいた「生成AIができないこと」がひとつあります。
それは、「生成AIはHOW(手法)には長じているが、一方で、WHAT(コンセプトやメッセージ)を意図することができない」というものです。

最近は画像生成AIもよく触るのですが、AIで作った画像には「ナラティブ(一貫性のある意図)」が存在しません。
なぜなら、AIは無数の情報ソースの中から要素を組み合わせて、確率論的にアウトプットを生成しているに過ぎず、それは言い換えると「寄せ集めの材料で作ったハリボテを生み出している」ということだからです。

たしかに、生成AIが生み出したアウトプットというのは、一見すると「確からしそう」「なんかよさそう」ではあるのですが、じゃあそれをどうやって使おう?となると困ってしまうことが多くありません。
生成AIには「意図」がないので、こちらが想定している文脈に配置してみたときに、どうしても拭いきれない違和感が生じてしまう
からです。

同様に、データ分析においても「HOW(手法)には長じているが、一方で、WHAT(コンセプトやメッセージ)を意図することができない」という特徴が、生成AIの限界を規定しています。

自社の売上データを参照して「売上の高い商品はどれ?」と聞けば、生成AIは的確な答えを返してくれるでしょう。
しかし、「今後、自社の売上を伸ばしていくうえで注力すべき商品カテゴリはどれ?」と聞いたときに、満足する答えが返ってくるとは思えません。

それは、「自社の売上を伸ばしていくうえで注力すべき商品カテゴリ」を考えるためには、前提として「ナラティブ(一貫性のある意図)」が必要だからです。

生成AIは、人間的活動をエンパワーメントするが、非人間的活動をディスラプトしていく

ここまでの内容をまとめると、以下のとおりです。

  • 前処理や探索的データ分析(EDA)は、生成AIによって効率化される

  • 生成AIはナラティブ(一貫性のある意図)を持たないため、HOWに長じている一方でWHATを意図することができない

したがって、確かに前処理や探索的データ分析(EDA)は効率化されうるのですが、それはあくまでも「WHATを意図することができる人間の存在があっての話」ということになります。

いろいろなところで言われている話ですが、仮説を立てたり、課題を設定したりすることは、生成AIにはまだできません。
このようなタスクも「AGI(汎用人工知能)」であれば実現可能だと言われていますが、その開発にはまだ時間がかかりそうです。

仮にAGIが開発されたとしても、AGIと対話・議論しながら考えを深めていける人間がいなければ、AGIが有効活用されることはありません。
どれだけAIが進化しても、「WHATを意図することができる人間の存在」は必要です。

まとめると、AIは「WHATを意図するような人間的活動」をエンパワーメントしていきます。一方で、「HOWに長じるような非人間的活動」をディスラプトしていくでしょう。

したがって、AI時代のデータアナリストの役割とは、「WHATを意図するような人間的活動」を通じて、より効果的なデータ分析の要件定義や設計、そして分析結果のプレゼンテーションを行なうことだと言えます。

HOWにのみ長じたデータアナリストは、どのようにして駆逐されていくのか?

では、「WHATを意図するような人間的活動」ができない、HOWにのみ長じたようなデータアナリストは、どのようにして駆逐されていくのでしょうか。

僕は、AI活用の最も優れた点は「高速でフィードバックループが回ること」だと考えており、このポイントをおさえてAIを活用する非データアナリストたちが、データアナリストの仕事を奪っていくと考えています。

わかりやすく、生成AIでイラストを描くことを例に説明します。

従来、イラストに熟達するためには、自分でイラストを描いて、その結果からフィードバックを得て描き方を修正をする、という工程を繰り返す必要がありました。
しかし、生成AIが登場したことによって、自分でイラストを描かなくても、生成AIにイラストを生成してもらえば、その結果からフィードバックを得ることができ、それに応じてプロンプトを修正することで、イラストに熟達することができるようになりました。

従来の手法だと、1枚の絵を描くのに1時間かかっていたところが、わずか1分で1枚の絵を描くことができるようになったわけです。
もちろん、自分で描いてみるよりは学習効果は低いでしょうが、大切なのは「高速でフィードバックループが回ること」です。これにより、1回あたりの学習効果は低いものの、回数を重ねることで高い学習効果を実現できます。

同じことがデータ分析の世界でも言えます。

従来はSQLを書いてデータを抽出し、データを見ながら前処理をし、BIでEDAをして、プレゼンテーションにまとめて… といったことをすべて人間がやらなくてはなりませんでした。

しかし、自然言語ベースでこれらのタスクを実行できるようになり、従来は1日かかっていたタスクが1時間で完了できるようになると、「高速でフィードバックループが回る」ようになります。
結果として、HOWの熟達スピードが段違いに早くなるため、非データアナリストがすぐにデータ分析を実践できるようになります

特にクリエイティブな領域(Webデザインなど)でない限り、HOWのレベルの差は、大きなアウトカムの差を生み出しません。
したがって、HOWにのみ長じたデータアナリストは、高速でHOWに熟達してしまう非データアナリストに駆逐されてしまうのです。

改めて、AI時代のデータアナリストは、「WHATを意図するような人間的活動」を通じて、より効果的なデータ分析の要件定義や設計、そして分析結果のプレゼンテーションを行なっていくことで、その価値を高めていくしかありません。

おわりに

弊社では、フルスタックなマーケティング支援事業を行なっております。

私に興味を持ってくださった方がいらっしゃいましたら、お気軽にお問い合わせください。

Xアカウントはこちら。
https://twitter.com/fsm_shimizu

この記事が気に入ったらサポートをしてみませんか?