【読了】データ分析人材になる
組織論とかプロジェクト管理
手を動かす視点を持ったマネージャになるために
はじめに
以下が書いてある本
・第1-2章:データ分析を進めるためのフレームワーク(5D)
・第3章:データ分析人材育成法
5Dフレームワーク
①Demand:要求を聞く
②Design:全体像を描く
③Data:データを集める
④Develop:分析する
⑤Deploy:提供する(相手に行動してもらう)
データサイエンティストになる必要はない、業務を知っているなら「ビジネストランスレーター(ビジネスに役立つデータ分析人材)」になればいい
第1章 経験値を上げる ~失敗と成功の経験談~
1-1 多くの企業が直面している課題
レベル1企業の課題
①施策検討にデータ活用する文化がない:Excelは集計するくらい
②経営層やミドル層がデータ分析を理解できていない:まともな投資ができてない
③トップダウンの見切り発車プロジェクトが多い:出入り業者の提案書に煽られている
④レポートが埋もれている:相手の行動に繋がるループができあがっていない
⑤データ分析結果に基づいて判断する風土がない:ネガティブな分析結果は受け入れられにくい
⑥KPIの数値だけを追いかけている
⑦分析担当者が業務に詳しくない
⑧部門によりデータ分析に対する認識が異なる:部門によっては「簡単な集計」程度に考えている
⑨過去の分析モデルやKPIに縛られている
1-2 失敗エピソード
・Demand:課題解決ではなく、データ分析する(高度な分析技術を使う、真新しい洞察を得る)こと自体が目的になってしまう
・Design:どこまで到達するためにどれだけの予算を使うかという全体観を描かないままプロジェクトを進めてしまう
・Data:データのサイズは大きくても質が悪いため分析に使えない
・Develop:機械学習を使うと予測はできても分析結果の説明や改善策の特定ができない場合がある
・Deploy:分析結果を報告しても行動してもらえない(現場を動かすには、データ分析チームからの提言ではなく、経営管理者からの指示出しが必要)
1-3 成功エピソード
・Demand:目的を仮説検証(どの仮説が正しいか確認する)にした
・Design:現状で入手可能なデータに基づき分析モデルを試作してから、改善&仕組み化のために必要な課題を関係者に提示した
・Data:なんとなく顧客情報を集めるのをやめて、予測に使えるデータに絞って収集するようにした
・Develop:コントロール可能な要素を使って予測モデルを作成した
・Deploy:データ分析チームがリードして、ロイヤルティ指標データの収集→ダッシュボードの共有(誰でも同じ画面を見て議論できる)→サービス改善ミーティングのサイクルを回した
1-4 成功事例応用編
①Demand:目的を明確化する(なぜデータ分析する必要があるのか)
②Design:アウトプットを握る(どのようにレポートしたら目的を達成できるか)
③Data:データを集め方を決める
④Develop:現場に分かりやすい分析手法を選ぶ
⑤Deploy:アウトプットに基づいて現場の施策を立て、現場スタッフと一緒に施策を実行する(分析者が現場を理解していることを、現場に理解してもらう)
データ分析者はマーケティング思考(現場を巻き込む方法)を学ぶべき
第2章 実践5Dフレームワーク
・5Dは逐次実行できるものではなく、Demand↔Design↔Dataは反復が必要
・Dataでデータを完璧に揃えてからDevelopに進むよりも、まず入手しやすいデータで分析してみたほうがよい
2-1 ステップ1 Demand
・解くべき問題を定義する
・アクションに繋がらない分析結果に価値はない
・どういう分析をすればビジネス的なインパクトのある結果を提示できるのか?
①これまでどんな分析をしていたのかヒアリングする
②分析結果を基に、依頼者が何をしたいのか理解する
③課題の背景を依頼者と同じレベルで理解できるまでヒアリングする
④分析方針を明文化し、提案&合意形成する
⑤期待を調整する
期待調整のコツ
・いきなり期待の100%に答えようとせず、要素に分解する(どうせ言われたことをそのままやっても満足されないことは多い)
・コミュニケーションを取り、「どんな条件がクリアされていたら、いつまでに何を提供できるのか」を段階的に整理する
2-2 ステップ2 Design
・何をインプットとして/どんな分析をして/何をアウトプット(納品物)するのか、を定義する
・分析作業に入ると、次々と追加分析のアイデアが生まれ、時間と予算を使い込んでしまうことがあるので注意
・限られたリソースのなかで結果を最大化するための計画を立てるのが仕事
典型的なアウトプットの種類
・集計
・可視化
・仮説検証
・予測モデル:精度と説明可能性のどちらを優先するか?
・まだ分析しないうちから納品物を決めることになるため、結果的に依頼者の期待に沿えない場合があることを事前に納得してもらう
・「このデータをこう分析した結果、何もインサイトは得られなかった」という報告には意味があり、以降のデータ分析サイクルに活かせる(結果が出ない観点で分析することを止められる)
①目的の明確化:分析で解決したい課題をより明確に
②仮説の明文化:仮説を立てないと検証しようがない
③分析に使えるデータの検証:データは利用可能か、利用可能でなければ収集するのか/代替するのか、どの期間のデータを分析対象にするか
※分析可能かどうかの判断するためのトライアルを行うこともある
④分析手段の合意形成
⑤アウトプットの合意形成
2-3 ステップ3 Data
・必要なデータが揃わず、数ヶ月を要したり、プロジェクト頓挫の原因になることも多い
・データは必ずしも大量である必要はない(そのために推測統計学がある)
データベースにテーブルがあっても、
・フィールドの業務的な意味が解らない(定義書が業務と乖離している)
・値が格納されていない
・名寄せが必要
・文書データしかない(テキストマイニングする必要あり)
・そもそも使えない(意図通りのデータを格納できていない)
①目的達成に必要なデータを検討する
②データを入手するためにかかる時間と費用を確認する
③データ提供を依頼する(依頼先に負担をかけることになるため調整が必要)
・テーブル定義書を見せてもらう
・抽出フィールドや抽出条件を伝える
・出力形式を伝える(csv、区切り記号、など)
・受領手段を決める(オンラインストレージなど)
データの種類
・生データ/加工済みデータ
・システム生成データ/マニュアル生成データ
2-4 ステップ4 Develop
データ分析を実行する
・理論は実践しながら理解する
・予測精度と説明可能性のどちらを優先すべきか考慮する
・現実的な施策案になるように現場を理解する
・数値だけを独り歩きさせない(予測値には前提条件や精度が必ずある)
分析会社を利用する際の注意
・お互いの役割分担を明確にする
・自社の課題を理解してもらう(仮説があれば伝える)
・サンプルデータを見てもらい、何ができるか提案してもらう
・スケジュールを明確にする(特に時間がかかりそうな作業内容を明確にする)
・分析手法を明確にする(目的に応じた分析手法を提案してくれるか?)
・アウトプットを明確にする(目的に繋がらないアウトプットでは意味がない)
・結論が実現不可能か、または当たり前になることがある
・データが提供できず、充分な分析ができないことがある
①分析環境を整える
②データ特性の確認:鮮度、偏り、粒度、件数
③データの加工・分析:前処理→集計(可視化)→分類/回帰
④結果を見せる際のストーリーを作る:前半は納得できる結果、後半は発見させる結果を持ってくると、受け容れられやすくなる
⑤可視化ツールを使って分析結果を見ながら議論する
2-5 ステップ5 Deploy
・ダッシュボードが更新されなくなる(自動化できていない、前担当者からの引継ぎ不足)
・ダッシュボードが議論に使われない(ダッシュボードへのアクセスが限定的)
①インプットデータ更新の自動化
②分析フローの自動化
③予測モデルの更新(再学習)
④ダッシュボード更新の自動化
第3章 5Dフレームワークによるデータ分析人材育成法
3-1 人材育成に苦慮する企業
データ分析人材にはたくさんのタイプに細分化され、微妙に関心事が異なっているため、ニーズにマッチした人材を外部から調達するのは困難
(そもそもニーズを明確に把握するのが困難)
・データエンジニア
・データサイエンティスト
・データアナリスト
・機械学習エンジニア
・データマーケター
など
たとえデータ分析の研修を受けても、現場に
①業務上の制約:業務でデータ分析を使う機会がない
②物理的な制約:データにアクセスできない/分析ツールが使えない
③人事評価の制約:上司はデータ分析よりも勘/経験/度胸を重視する
の制約がある限り、忘れて使いものにならなくなってしまうので、
①ビジネスに活かす力も同時に付ける
②情シス部門の協力を取り付ける
③まずは社内課題を解決する勉強会をやる(スモールスタートでも実際の課題を解決しデータ分析の有益性を認知させることが大切)
データ分析スキルの3要素
○ビジネス
・業界の業務ドメインに対する理解
・マーケティング(フレームワークの使い方)
・課題整理
・仮説に基づく施策立案
・他部門を巻き込み動かすアウトプット力(コミュニケーション力)
○サイエンス
・分析手法の使い方
・分析手法についての理論(数学)
○エンジニアリング
・データベース
・プログラミング
・分析ツールの使い方
・可視化/集計
・モデル実装
3-2 管理職・リーダーのための5Dフレームワーク
データ分析人材育成のステップ
①Demand:分析組織の目的を定義する
②Design:分析組織を設計する
③Data:データを扱う方法を教育する(外部専門家に常駐してもらう等)
④Develop:データ分析レベルを向上させる
⑤Deploy:分析結果が社内で使われるようにする
分析組織の目的例:まずやりたいことを具体化しないと、人材の育成/調達要件が見えてこない
・PDCAを回すためにマーケティング施策案を迅速に出し続けること
・効果的で説明可能なマーケティング施策案を作ること
・経営指標のダッシュボード(可視化)を実装すること
ツール:プログラミングできなくてもGUIツールで同様のことができる
・加工/集計/モデリング:Alteryx、KNIME、SPSS Modeler
↓
・可視化:PowerBI、Tableau、QlickView
まずは可視化ツールから触ったほうがデータに慣れやすい
新しい洞察(=仮説)を立てて、実データを使って試行錯誤するサイクルを高速に回す(問題解決思考)の訓練もできる
例:
「ある商品の売上が落ちたので原因を分析してほしい」
↓Where分析(どこに問題があるのか?)
「30代女性の平日夜間の売上が下がっているから」
↓Why分析(なぜ問題が起きているのか? ※ドメイン知識がある部分に偏って掘り下げないようにPESTLEフレームワークなどを使う)
「在宅ワークの増加により、店舗付近に出勤している女性数が減ったため」
↓How分析(どうすれば問題を解決できるのか?)
「」
やってはいけない育成方法
・分析手段をプログラミングに限定する
・「何回同じことを聞くんだ」と言う
・いきなり高度なレベルを求めない
3-3 文系データ分析人材の育成の留意点
略
3-4 文系データ分析人材が育てば企業文化が変わる
略
3-5 三井住友海上のデジタライゼーション
MS&ADインシュアランスグループ
損害保険業界
RisTech(Accentureと協力):自然災害リスクや交通事故リスクを精度よく予測する
あとがき
・データ活用ができない組織は、データ分析人材が不足してるのではなく、分析プロセスが有効でないため、既存人材を活かしきれていないだけであることが多い
・狭義のデータサイエンティスト(統計などの数学理論賀解り、プログラムを実装できる)を採用できなくても、「ビジネストランスレーター(ビジネスに役立つデータ分析人材)」を育成できれば、データ活用組織になる
この記事が気に入ったらサポートをしてみませんか?