見出し画像

データ分析・活用の事例を分析する:プロセスのパターン

分析屋の下滝です。

本記事のシリーズでは、データ分析・活用だと思われる事例を分析しながら、我々はどのような活動をデータ分析やデータの活用だと呼んでいるのかを考察しています。

本記事は、それら事例を分析した結果をまとめていく記事となります。事例の記事が増え次第、本記事をアップデートしていきます。

過去の記事の一覧はこちら。

なお、データ分析の各種の枠組みを分析していくという別観点のシリーズは以下を御覧ください。

問題の背景とアプローチ

データ分析

データ分析の概念が未だに掴みきれていません。
・データを「分析すること」と「集計すること」に違いはあるのでしょうか? 集計してないけれど分析するケースはあるでしょうか? 
・データを「分析すること」と「活用すること」に違いはあるのでしょうか? 分析してないけれど、活用しているケースはあるでしょうか?
・データを「分析すること」と「AIを適用すること」に違いはあるのでしょうか? 
・データを「活用すること」と「AIを適用すること」に違いはあるのでしょうか?

文献をみてみます。

たとえば『データドリブン思考』ではデータ分析という言葉は「集計やグラフ作成から機械学習までを包含する」言葉として使われています。

一方で『POSデータ活用検定テキスト 第1版』では、次のような説明がされています。

市場POSのデータの分析ツールや小売POSデータの開示システムでは、「○○分析」という名称でメニューが並んでいることもあり、「集計」と「分析」が混同されがちですが、実際には集計と分析は大きく異なります。

分析ツールや開示システムで、データ分析の3軸と粒度、集計指標を設定して出力されるアウトプットはあくまでも「集計」結果です。何らかの条件でデータをまとめた(縮約した)結果に過ぎません。「分析」とは集計結果から得られた「数値」を何らかの基準と比較して「評価」したり、特徴を読み取ったりすることを意味します。例えば、ある商品の当年の売上が11,000,000円だったとします。これは集計結果です。前年の売上10,000,000円と比較することで、当年の売上は前年より10%改善したということがわかります。これは分析結果です。さらに、データを深堀りしてその要因がどこにあるかを探っていくことも「分析」です。

『POSデータ活用検定テキスト 第1版』, p.13

このようにデータ分析という言葉の意味する範囲にはばらつきがあるようです。

データの役割

また、ビジネスにおけるデータの役割は何でしょうか? 課題を解決? 課題を発見? 仮説を立案? 仮説を検証? 施策結果の確認? 何らかの示唆を得る? 意思決定を支援? 意思決定を自動化?

この点に関してもいくつかの文献をみて確認してみます。

たとえば『デジタルマーケティングの教科書: データ資本主義時代の流通小売戦』ではデータ分析とは「仮説を確認する行為であり、方程式を説いて答えを発見する行為ではない」と書かれています。

他には『店頭マーケティングのためのPOS・ID-POSデータ分析』では次のような記述があります。「…そのため、ID-POSデータを活用することで「顧客の買い方」に基づいた売場の課題発見と施策の検証が可能となります」。

他には『リテールデータ分析入門』では、「以上のように問題点の発見、仮説づくり、実験結果の分析においてデータ分析は重要な役割を果たす」とあります。

他には『ID-POSマーケティング』では、このような記述があります「このように、ID-POSのデータを確認すれば、ターゲット・セグメントの追加と店頭プロモーションのバリエーション強化が修正課題として浮かび上がってきます。」

他には『ショッパー・マーケティング』では次のような記述があります。

B店のFSPデータ、ゴンドラ配分のデータを用いて、B店のレイアウトの現状について分析をおこなった。ここでは、
ステップ1:B店の顧客層の年代、購買カテゴリーの状況の把握
ステップ2:カテゴリーのスペース生産性の把握
ステップ3:顧客の店内回遊の状況把握(近接売場間での同時購買傾向の把握)
という3つのステップで分析をおこない、現状を捉えた。
 分析の結果、「青果と調味料の同時購買率が他店と比べて低いこと」が課題として抽出された。そこで青果と調味料の同時購買率の上昇を目標として設定し、その目標を達成できるようなレイアウト改定計画を考えた。具体的には、青果売場に調味料売場を近接させるレイアウトへの変更を考えた。

『ショッパー・マーケティング』, p.218

他には『POS・顧客データの分析と活用』では「POS関連データは、現在さまざまなマーケティング上の意思決定領域で活用されている」、「…もちろん、POS関連データは小売業自身のマーケティング意思決定にも多く利用されている。」とあります。

つまり、データ分析、データ活用、あるいはデータの役割とは、少なくとも次のようなものがありそうです。
・仮説を確認するため
・仮説をつくるため
・課題を発見・抽出するため(問題点を発見するため)
・施策の検証のため(実験結果の分析のため)
・意思決定のため

問題

以上のように、データ分析や活用の定義や、その役割は、かならずしも十分に整理されていないように思えます。このことは、データ分析や活用を行ったり学ぶ者だけではなく、関係者たちとの間においても、コミュニケーションの質を低下させる恐れがあります。

本シリーズでは、そのような問題意識をもとに、問題解決のアプローチとして、様々なデータ分析・活用事例を分析することで整理を行いたいと思います。

プロセスのパターンによる表現

様々な事例を分析するにあたっては、分析のための共通の枠組みがあると便利です。そこで、本シリーズでは、プロセスのパターンとして各事例を表現することで(モデル化することで)、各事例からデータ分析や活用の特徴となる要素を特定し、整理していくことにしました。

現時点では以下のプロセスのパターンを特定しています。

・集計の動機を生み出すプロセス
集計のプロセス
・知識を生み出すプロセス
 ・比較のプロセス
  ・非課題抽出プロセス
  ・課題抽出プロセス
・機会を探す動機を生み出すプロセス
・機会となる仮説を生み出すプロセス
・機会となる仮説を検証するプロセス
・仮説を生み出すプロセス
 ・存在を期待する仮説を生み出すプロセス
 ・施策の実行結果を期待する仮説を生み出すプロセス
・仮説を検証するプロセス
 ・存在を期待する仮説を検証するプロセス
 ・施策の実行結果を期待する仮説を検証するプロセス
・施策案を生み出すプロセス
・疑問を生み出すプロセス
・疑問に対する仮説を生み出すプロセス
・疑問に対する検証方法を生み出すプロセス
・疑問に対する仮説を検証するプロセス
・施策を生み出すプロセス
・施策案を施策に具体化するプロセス
・施策の仮説を生み出すプロセス
・施策を実行するプロセス
・施策の仮説を検証するプロセス

各プロセスはそのプロセスへのインプットとなる要素とアウトプットとなる要素を持ちます。

プロセスへのインプットとアウトプットの要素が、あるプロセスとその他のプロセスを関係を決めます。つまり、あるプロセスのアウトプットの要素は、その他のプロセスへのインプットの要素となります。

ある事例をもとにした具体例は以下となります(仮説を生み出すまでの途中のプロセスです)。

このようにプロセスを特定し、その枠組の中で分析することで、たとえば、以下のようにさらに踏み込んだ分析ができるようになります。
・どのプロセスがデータ分析での必須のプロセスになるのか。たとえば、「比較のプロセス」なしにデータ分析と思われる行為は可能でしょうか?
・データ分析を構成する最小単位のプロセスは何か。たとえば、上記のプロセスのどれか一つのプロセスだけで、データ分析と呼べるプロセスは存在するでしょうか? データ分析だと呼べる最小のプロセスの組み合わせは何でしょうか?
・データ分析を構成するプロセスが異なるプロセスは存在するか。つまり、プロセスの組合わせがあるデータ分析を構成するとした場合、組み合わせの違いは、データ分析のパターンがいくつか存在することを意味するのでしょうか?

プロセスのパターンに基づく原理

本節では、事例をもとに特定した原理を紹介します。

プロセスの出現の範囲

事例を分析して判明したことの一つは、ある一つの事例において、これまで特定しているプロセスパターンの全てが使われるわけではないという点です。

次のように整理できます。
・データ分析を含むと思われるプロセス群(プロセスの順序)は、少なくとも事例として区別した場合、同一のプロセス群となるとは限らない。事例Aと事例Bでは、使うプロセスパターンが異なる場合がある。

このことは以下の疑問を生みます。
・同一のプロセス群となることがあるか
・似たようなプロセス群となることがあるか
・似たようなプロセス群となるなら、そのような似たようなプロセス群
はいくつ存在するか

集計者と使用者の非同一性

プロセスの最初の集計を行ったものが、その集計結果を使うものと異なるという点です。

この点に着目するのは次の2つの理由のためです。
1.集計結果をデータ分析なしで活用できる可能性があるかもしれないため。これは、データ分析とデータ活用が異なるプロセスであることを示唆します。
2.集計の結果がどのように幅広く使われるのかは分からないため。集計結果をどのように使うのかは、使用者の置かれている状況に依存すると考えられます。
A:使用者が異なれば、異なる使われ方をする。
B:使用者が同じであっても、使い方のイメージができなければ、使われない。
C:使い方のイメージを知っている場合と知らない場合では、プロセスが変わる可能性がある。
D:ある集計結果の使われ方の種類は固定ではなく、ときとともに増える可能性がある。

汎用的なプロセスの順序

これは「集計の動機を生み出すプロセス」のもので、このプロセスのアウトプットを「集計しなければ仮説の検証ができないため」と表現したものです。ここには、特徴があるように思えました。汎用的なプロセスの順序となるという特徴です。仮説の検証をデータで行うためには集計が必要となるというプロセス間の順序であり、個々の事例に依存しないようなものであるといえます。

なお、データを用いた仮説の検証に常に集計が必要かどうかは確認する必要があります。
プロセス構成パターン1(事例で明らかになったもの):仮説を生み出すプロセス -> 集計の動機を生み出すプロセス -> 集計のプロセス -> 仮説を検証するプロセス
プロセス構成パターン2(集計のプロセスが無いもの。存在するかは不明):仮説を生み出すプロセス -> 仮説を検証するプロセス

残された課題

(考察予定)

その他のプロセスの枠組み

CRISP-DMとの違い

(考察予定)

参考文献

(参考予定)
・Evolution Paths for Knowledge Discovery and Data Mining Process Models, 2020, リンク

付録:プロセスのパターンの詳細

(作成予定)

株式会社分析屋について

ホームページはこちら。

noteでの会社紹介記事はこちら。

専用の採用サイトはこちら。

求人情報はこちら。

【データ分析で日本を豊かに】
分析屋はシステム分野・ライフサイエンス分野・マーケティング分野の知見を生かし、多種多様な分野の企業様のデータ分析のご支援をさせていただいております。 「あなたの問題解決をする」をモットーに、お客様の抱える課題にあわせた解析・分析手法を用いて、問題解決へのお手伝いをいたします!
【マーケティング】
マーケティング戦略上の目的に向けて、各種のデータ統合及び加工ならびにPDCAサイクル運用全般を支援や高度なデータ分析技術により複雑な課題解決に向けての分析サービスを提供いたします。
【システム】
アプリケーション開発やデータベース構築、WEBサイト構築、運用保守業務などお客様の問題やご要望に沿ってご支援いたします。
【ライフサイエンス】
機械学習や各種アルゴリズムなどの解析アルゴリズム開発サービスを提供いたします。過去には医療系のバイタルデータを扱った解析が主でしたが、今後はそれらで培った経験・技術を工業など他の分野の企業様の問題解決にも役立てていく方針です。
【SES】
SESサービスも行っております。