【読書メモ】データ分析力を育てる教室
Yappli(ヤプリ)のウェビナーに登壇されていた松本健太郎さんの話が面白かったので、最近出版された『データ分析力を育てる教室』を読んでみました。
事業会社の中でデータ分析の重要性が語られる時に個人的に感じていた違和感みたいなものが解消される読後感良い本でした。
この記事では特に自分の仕事に活かしたいなと
思った内容を整理してみようと思います。
1.そもそもデータ分析とは何か?
データ分析とは「集めたデータから、
目的に沿った知見を得ようとする作業」。
知りたいことをデータから知るための
作業全般がデータ分析。
優れた意思決定を下す為の補助として
データ分析を行う。
2.データ分析のプロセス
プロセスには極めて正統な解き方がある。
問題→問い→仮説→データ収集→証明→
結論→意思決定という一連のプロセス。
データ分析には仮説構築(問いに対する仮説)と仮説検証(結果に対する仮説の合致度を検証)という2つの側面がある。
ちなみにデータ分析プロセスは実験科学に近い(問いを起点に観察→推論→仮説→検証→考察していく)。
3.データ分析が上手な人がやっていること
データ分析が上手な人は解像度をまず高める。
解像度が高い=解くべき問題に対して、何が分かっていないか?分かっている状態を指す。
(問題の大きさ、構造、全体像)
解像度を高める練習として因果関係を捉えてみる。因果関係に矛盾がある場合、解像度が低いから見えていない何かがあると考えることができる。
あるいは問題同士の因果関係を描いて解像度を高めてみる。
4.良い問いとは何か?
下記2点が押さえられている場合、
良い問いと言える。
①知りたいと思うことが明確
②問いの答えが分かれば次の行動につながる
また問いには常に仮説を持つ。
仮説とは、正解かどうか分からないけど、最も確からしいと考えられる仮の考え。ある現象や法則性を合理的に説明する為の仮の説。
5.演繹法と帰納法
・演繹法
ルールや法則に基づく物事に
当てはめて結果を導き出す方法。
→抽象度の高い前提から、具体的なルールや法則に当たる結論を導き出す。
・帰納法
複数の事実や事例から共通点を導き出し、
一般論となる結論にたどり着くための方法。
→具体を抽象に昇華させる思考法。
6.筋の良い仮説を作るには?
筋の良い仮説は、前提や結論を
くつがえす事象に出会うことで生まれる。
前提を疑う、結論を疑う。
それこそが「仮説構築」の近道。
7.仮説つくりの3つ目の型”アブダクション”(仮説推論)
・演繹法/帰納法とアブダクションの違い
演繹法と帰納法は分かっている「前提」から「結論」を導く手法。
アブダクションはわかっている「結論」から「前提」を導く手法→可能性と探索がポイント。
整合性が取れるなら、その仮説を採用する。
アブダクションで重要なのは、事実の「観察」。
・良い仮説とは
1.問いに対して明確で明瞭な仮説になっている
2.その仮説にワクワクするか?面白そうか?
3.その仮説はデータで裏付けできそうか
8.観察力と洞察力を鍛える
・観察する力
物事を正しく捉えて、真実を見極める。
本質を見通す力。
↓
ABC理論(※)を理解する。
∟Activating event (出来事)
∟Belief(信念、固定概念)
∟Consequence(結果)
※認知行動療法の一つ
・観察力を高める訓練法
1.ファクト(事実)とオピニオン(主観)を見極める
主観的な意見を分けた後にファクトを正しく理解しにいく。
2.無いもの思考とあるもの思考
あるデータとないデータの共通点や
相違点を見抜き結論を導き出す。
・洞察とは
英語でinsight。
spirituality(精神性)の意味も持っている。
物事の表面的な有り様を突き抜けて本質を見通すこと。
洞察とは突然新しい方法に気づき
問題と向き合える問題解決能力。
・学習心理学としての洞察
問題を構成する要素間の関係と構造を
理解することで解決に至る学習過程。
9.仮説構築と仮説検証/論証と実証
・仮説構築
筋の良い可能性を広げる。
・仮説検証
確からしい可能性に絞り込む。
・論証
論理によってある事柄が
正しいことを確認すること。
・実証
実験等を通じて確かな事実を提示すること。
仮説は真実ではないことを証明(※)する反証を繰り返して、それでも証明できないものだけが理論として生き残ります。
※証明とは仮説が真であることを証拠をもってキチンと説明すること。
10.新たに数字を生み出す縮約と分類
・縮約
何百とある列を圧縮し、
新たな列を生み出す方法。
・分類
縮約が列を減らす作業に対して分類は
行を減らす作業。 分類は物事を分け、
同類を発見する作業。
数字はチェックする際は①定義、
意味の確認 ②傾向の確認して
関係者間の認識ズレを無くす。
11.ビジネスにおけるデータ分析にかける時間
・仮説構築のためのデータ分析
→70〜80%
・仮説検証のためのデータ分析
→20〜30%
・仮説証明のために統計学やデータサイエンス、機械学習を用いた分析に欠ける時間
→5%程度
あくまで統計学やデータサイエンス、機械学習を用いた分析とは単なる処理の一つ。
12.気になったキーワード
・Fast思考とSlow思考
認知心理学者にしてノーベル経済学賞受賞の
ダニエル・カーネマンが提唱。
【Fast思考】
直感や感情的な連想に基づく判断。
事実関係を見ないで、過去の経験に基づき、
直感的に感情的に判断してしまう高速な思考状態。
【Slow思考】
注意深く合理的思考に基づく判断。
論理的、理知的な思考。発動には努力(集中力)が必要とされる。Slow思考を常に作動させていると脳に大きな負担がかかる。
・ヒューリスティック(heuristic)
「発見的手法」という意味の心理学用語。
必ずしも正しい答えではないが、経験や先入観によって直感的に、ある程度正解に近い答えを得ることができる思考法。 「経験則」と同義であるとも言われている。
13.最後に
記事冒頭でデータ分析とは「集めたデータから、目的に沿った知見を得ようとする作業」であると記載していました。
では、データ分析自体の目的とは何なのでしょうか。
あるデータアナリストは分析の目的とは「未来を変えるために因果関係を突き止めること」だとコメントしていました。
個人的にしっくりくる内容で、自分も良い未来に舵を切る為に分析という手段を使っていきたいと思いました。
引き続き勉強を続けます。
この記事が参加している募集
この記事が気に入ったらサポートをしてみませんか?