見出し画像

データ分析・活用プロジェクトを料理に例えて理解してみよう

データ分析というと、社内データをExcel関数による集計やピポッドテーブル等の高度な方法を使って、グラフ出力とともにそこから読み取れる情報をレポートにして報告する、単調な作業のイメージが強いかも知れません。

一方、データ分析を駆使するデータサイエンティストが21世紀で最もセクシーな職業であるなどと言われていますが、この差は一体何なのでしょうか?

実際、Excelデータの分析作業はプロジェクト全体[1]で捉えた場合、その位置づけはプロセスのごくごく一部で、また今後AIに任せられるであろう機械的作業が大半です。

では何が一体セクシーなのでしょうか?

データ分析プロジェクトは、料理と対比してイメージすると理解がしやすと思います[2]。

例えば、一般家庭の専業主婦が夕飯の献立を考えているシーンを想定してみましょう。

この場合、前日の夕飯メニューから今朝の朝ごはん、小学校に通う子供の学校給食の献立、天候の変化等から想定される体調の変化などを前提に、近所のスーパーに出かけて、今日はカレーにしよう!と決定して、冷蔵庫に足りない食材を思い出しながら、家計の許される範囲で調達します。大好きなお肉の選択も値段を見ながら、夕方のタイムサービスも意識しながら慎重です。

さて、すこし脱線しましたが、データ分析プロジェクトでは

献立(夕食への対応)  ⇒    目的(現状と課題)と仮説立案
食材        ⇒ データ選定
調理        ⇒ データ分析  
食事        ⇒ 現場による分析結果の活用(課題解決)
おかわり(家族団らん、明日への意欲)⇒ 問題解消

データ分析プロジェクトの作業工程

と対応させることができそうです。

目的(現状分析と課題)と仮説立案では、日常家族のことを良く知り、献立を決断する主婦のように、データ分析技術に詳しい人材と併せて、社内課題に精通して各部門から信頼されている調整役の存在が必要不可欠です。このあたりを社内固有の課題や背景を十分理解していない、しかし表向き豪華な実績のある外部コンサルに丸投げしてしまうと、投資金額に見合う期待とは真逆のもの(お昼の給食の献立もカレーだった!とか、肉はダメで野菜カレーで)が出てきたりします。この段階で、分析結果を活用する現場にも、プロジェクトの概要と協力依頼への根回しも重要です。

次にデータ選定プロセスですが、食材はスーパーに行けば揃えられますが、データの方はそうはいきません。カレーを作りたいから市民農園の畑を借り、1年かけて種から栽培するなどはありえない話ですが、ビジネスの現場では、手間暇かかるデータベース構築への投資に対する成果が事前には見積もることが難しい中で、ひとまず手元にあるデータでなんとかならないか?となるのが実際です。したがって、ビッグデータとは真逆の、スモールデータでかつ偏りのあるデータを扱わざるを得ず、得られる成果も良くて限定的な中で、データサイエンティストの経験の差が大きく出るところとも言えます。

次のデータ分析のステップでは、実際のデータの特徴を見ながら次のステップの運用を前提とした分析モデルの設計と評価を行います。Excelデータの加工や集計は、この実際のデータの特徴を見る部分に他なりません。狭義のデータサイエンティストとは、問題としている対象の振舞いをデータに基づいて数理モデルとして表現する科学者=サイエンティストですが、ビジネス現場では得られたモデルに基づいた問題解決のためのエンジニアリング力も要求される、高度な能力が求められます。

さて、以上の前提条件が満足され、分析モデルの評価が良好であれば、現場担当者に分析結果をどのように使っていきたいかを説明して、現場での効果検証の協力を仰ぎます。現場での効果検証にあたっては、意思決定の新旧プロセスをランダムに実行(A/Bテスト)して、どの程度の効果が実際にあるかを確認することが理想的です。その際、運用上発生し得る異常発生時にどのように対処すべきかに関して意見を交わし、最終的な合意に導きます。

最後の成果検証では、事前に設定した目的を実現できているかを定量的に検証します。そこで新たな課題が見つかれば、その課題を解決する新たな仮説立案、データ収集と分析、改善プロセスを継続することで、データ活用プロセスを組織として理解することができるのです。改善プロセスを確実に進めるためには、データベース基盤と解析・検証環境の自動化の仕組みも必要で、情報システム部門の協力を仰ぎながら進めることになります。

専業主婦の家事を年収換算すると1000万円などと言われることがありますが、食事・洗濯・掃除から、ご近所からの情報収集等その万能な裏方能力を発揮するには、経済面を支える夫の存在、たまにドジがあったとしても家族のねぎらいの言葉が救いとなるように、データサイエンティストは傍から見るとセクシーに見えるかも知れませんが、そのためには投資判断を行う経営者の深い理解と関与、業務プロセスのモデル化するに必要十分なデータ基盤整備(情報システム部門)、データの質の問題をカバーする業務知見に基づくデータ分析力、分析結果やモデルを使って実際の成果を出していただく現場の方の理解と協力の、どれ一つとして欠けることが許されない、組織力と潤滑なコミュニケーション力が必要とされる仕事なのです。

[1] データ分析プロジェクトのプロセスを定義したCRISP-DM(Cross-industry standard process for data mining)が古くから知られています。
[2]  Note: 分析モデルの設計から課題解決へのプロセス

※弊社では、データ分析プロジェクトにまつわる様々なご相談に、過去20年以上に渡るプロジェクト経験に基づき、ご支援しています。社内セミナーの企画等、お気軽にご相談いただければ幸いです。

製品カタログ




この記事が気に入ったらサポートをしてみませんか?