#157 【統計学が最強の学問である】
◾️はじめに
ビッグデータ、データサイエンティストが重宝されて久しいこの頃。
その基礎的な学問である統計学のお話です。
◾️感想
何をもって最強、の学問とするかはありますが、重要であることには間違いないです。
全ての事例を計算できることはほとんどないので。
ある意味コンピュータの処理能力やネットワークインフラ、倫理観などから全てをデータで取得できないから予測が必要でその手法が発達したのかも。
◾️要約(詳細)
◆第一章 なぜ統計学が最強の学問なのか?
統計学によって最善最適の答えを出すことが可能であり、それを使うか使わないかで選択する手段の良さが決まってくる。
IT化が進んだ今、何を計算するかが問われており、それをうまく掴むことが成功の鍵であり、そのために統計学が必須である。
◆第二章 サンプリングが情報コストを激減させる
ビッグデータとして全てのデータを扱うことが何をするにも必要、というわけではない。
サンプリングの技術と正確性は第二次世界恐慌じのアメリカから証明されている。
必要十分な最小の量でサンプリングした結果がずれる確率を考え、投資の効果を見極めるべき。
多額の投資をした後でさて何ができるだろう、は本末転倒もいいところ
◆第三章 誤差と因果関係が統計学のキモである
統計して出た結果をそのまま適用するのではなく、ちゃんと仮説にすることが大切。こうだとこう。その時、誤差なのかどうかは必須。
さらに因果関係の向きもしっかりと考え、その他の条件を可能な限り同じにし、仮説の検証をしていくべし。
◆第四章 「ランダム化」という最強の武器
条件を同じにするために、ランダム化する、という手法がフィッシャーによって生み出され、それは統計学を、科学を変えた。
農地でも区画をわけランダムに決めたい条件を与えることでそのほかの条件をほぼ同じにできる。
革新的な方法ではあるが、実施するには3つの壁がある。
現実、倫理、感情である。
現実に複数回起こすことができないもの、誰かが不利益を被るもの、感情としてなんかいや、というものについては統計学の力を発揮する場所はない。
◆第五章 ランダム化ができなかったらどうするか
ランダム化ができない状況の中でいかに何が最も結果変数に違いを生むのかをわかるために統計学は進歩してきた。
ケースコントロールやカイ2条分析をはじめとする一般線形化モデルなど。
そして、同じ傾向である傾向スコアを利用することでランダム化に近い因果関係の推定が行えることから、政策や教育にも使われるようになっている。
◆第六章 統計家たちの仁義なき戦い
疫学者は導かれる結果が1番の興味であるし、社会調査のプロは正確さに、
心理統計学者は質問の内容に命をかける。
こうしたように統計家たちの考えの違いをきちんと理解し、異なる立場で培われた知恵を自分の必要に応じて活用することが賢明である。
アクションを知りたいのにニューラルネットワークで導かれたので中身はわかりませんでは困る。
◆終章 巨人の肩に立つ方法
過去の実績に基づけ。
自説に基づくレビューは叙述的レビューとも呼ばれ、主観性に注意が払われるように。だからこそ客観的な系統的レビューに価値がある。
◾️アクション
統計学をビジネス、今の業務に活かす場があるかを考える
◾️ハッシュタグ
この記事が気に入ったらサポートをしてみませんか?