あなたが統計学をわからない理由
そもそも高校(大学受験)での「場合の数・確率」を苦手としていませんか?
※ これについての具体的な対策はあとで書きます。(スキップ可)
専門的な統計学がわからない原因①
微積分、線形代数といった基礎数学の力不足、まずこれ。
統計学の微積分(解析学)最低要件は、(当然なことばかりですけど)
ガウス関数の積分$${\int^{\infin}_{-\infin}\exp[-\frac{(x-\mu)^2}{\sigma^2}]dx}$$を計算できる
関数のグラフを数理的にイメージできる
$${\operatorname{e}}$$の肩は2次式だから上に凸な負、関数は原点($${x=\mu}$$)では関数は1、$${\infin}$$と$${-\infin}$$の無限遠で$${\operatorname{e}^{-\infin}}$$となり関数は0に近づく、といった感じ。
重積分ができる(確率変数の四則など)
たとえば、$${\Gamma(\alpha,\beta)}$$分布の積率母関数(モーメント母関数)のような下の積分ができない、と統計学に挫折します。
$$
\int^{+\infin}_{0}\operatorname{e}^{tx}\frac{1}{2^{\frac{n}{2}}\Gamma(\frac{n}{2})}x^{\frac{n}{2}-1}\operatorname{e}^{-\frac{x}{2}}dx=(1-2t)^{-\frac{n}{2}}
$$
この積分をフツウに積分してしまう方は素質ナシです。
微積分の対策は「独学・社会人向け低価格・低燃料マスターコース」があります。
線形代数についてもショートコースがあります。
専門的な統計学がわからない原因②
統計学には独自の習得しにくさがあります。
それは、昨今の統計学が広範すぎる。
機械学習(AI)は、世間的にはオール統計学を指しているように感じます。
これ、間違っています。
統計学は、その実、大きく次のように分類できます。
注:以下は、ワタシ個人的に思いついた分類を列挙したため、間違っているかもしれません。
基礎となる統計学(確率分布 ~ 推定 ~ 検定)
記述統計、推測統計 です。
回帰分析 ~ 多変量解析
ベイズ統計
時系列解析
アドバンスドに捉えれば、確率過程も含まれます。
さらに、統計学とは別にアルゴリズム的な統計解析が存在します。
機械学習
教師あり・なし 学習
強化学習
技法としては、
決定木・クラスタリング・SVM・ベイジアンネットワーク・ニューラルネットワーク など
わたしだって統計学の全体を隅々まで理解していない。
大型書店の店員さんが、書棚の管理がままならない、と嘆いています。
書棚専有率が、大学での数学科先生の割合に反比例して、
専門的な数学 : 確率・統計 = 6 : 4
と、「確率・統計の棚」が絶賛拡張されつづけています。
※ 統計学の専門家は数学科にいなくて、経済学や情報、文学、生物に属していることが多い。多くの統計学書籍を書かれている豊田秀樹先生は早稲田大学文学部教授です。
どだい、統計学手法を網羅的に理解するのは、ムリ。
のようなシリーズを読んで理解するだけで、2~3年かかってしまいます。付随する数学(測度論、関数解析、確率過程)、情報理論などの基礎内容を習得だけでも、ふつうは手一杯です。
という事情は、ここまで読まれた方なら、知ってますよね。
この広すぎる統計学への対応策は、統計書棚の前に立ち、必要な手法だけをピックアップする、しかない。
でも、統計学はあまりに広大で、自分がどこにいるのかわからなくなる。
こんなとき、どこまで統計学を理解できているのか、と、純粋な統計学とは何なんだろう、そんなとき、
竹内啓, 『数理統計学の考え方―推測理論の基礎』, 岩波書店, 2016
内容は『岩波講座 応用数学 方法11 統計的方法』とまったく同じです。
微分方程式 II /統計的方法/古典物理の数理 が収まっている(それぞれは分冊)こちらのほうがお得かも。
を読むと、我に返れること確実です。152ページという薄い本ながら、統計学の数理的基礎がまとめられています。この基礎は、簡単ではなく、根本的を意味します。高度に数学的ですが、数学的晦渋さ(定義~定理~証明な形式)はなく、統計理論の骨子がシンプルに記述されています。
統計的手法の多様性に、道を見失っている方に、正しい道を照らす灯台になるかもしれません。
そもそも高校(大学受験)での「場合の数・確率」を苦手としていませんか?
目覚めていない、つまり、まったく苦手な方向け
を2周する。ただし、
受験対策の発展問題をすべて解く必要はありません。
終わったらメルカリで売却してもいいです。
下掲する2冊目の本を半永久的公式集として使います。
ここを出来ていないのに、専門的統計学の微積分計算をしても、数式の意味が見えていません。まず、地に足をつけましょう。
何をもって目覚めていないとするのか?
順列$${_{n}P_{r}=\frac{n!}{(n-r)!}}$$、組合せ$${_{n}C_{r}=\frac{n!}{r!\cdot(n-r)!}}$$を公式として覚えている人は目覚めていません。
場合の数・確率は「公式を覚える」をしなくても解けます。分かっている人は、基本的に階乗$${n!}$$と$${_{n}C_{r}}$$の記号しか使いません。これらはあとで計算するためのシンボルとして書いておくだけです。$${_{n}P_{r}}$$や重複組合せ$${_{n}H_{r}}$$、重複順列$${_{n}\Pi_{r}}$$の記号を使いません。分数と一般二項係数の形式$${\begin{pmatrix}n\\r\end{pmatrix}}$$で、そのまま場合の数を表現します。
目覚めているけど、苦手意識がある方向け
『モノグラフ 確率』をやりこみます。場合の数・確率は、専門的な統計学の本でも書いていますが、それは形式的にであって、簡略な記述しかありません。
この本は素晴らしいので、敢えてウィジェット表示。
この『モノグラフ 確率』では、大学受験の必要なテクニックだけでなく、微積分を必要としない「場合の数・確率」を網羅的に解説されています。専門的な統計学では省略されがちな、基礎的な考え方・公式がまとめられており、公式集としてずっと使えます。
場合の数~確率~条件付き確率はもちろん
二項定理の様々な応用方法
統計学の本には書かれていない
代表的な離散的な確率分布である二項分布の使い方(独立試行)が丁寧に説明されている。
確率分布の計算ができるけれど、分布が示す事象を分かっていない、という方は多くありませんか?
ただ、全問題("確率と数列"は不要)を解かなくてもいいですよ。
さいごに
以前、講師をしていたとき、統計学の学習をする際に、先へ先へと進みたいがために、基礎となる「場合の数・確率」を疎かにしているケースが多いように感じていました。
今回挙げた書籍をやらないとしても、統計学の本で解説されている「場合の数・確率」の章はじっくり取り組んだほうがいいです。けっこう時間がかかります。確率分布といった微積分な統計学とは異なる難しさがあります。
たとえば、統計学の演習書として有名な
でいえば、「第一章 確率」はぜんぶ解く。
そうしないと、統計学の理解が空虚になってしまう。
これについては、高校での「物理」に似ています。物理公式を覚えているだけの人は問題を解けない。解ける人は公式を覚えていない。
確率はアンビバレンスな側面があります。
この記事が気に入ったらサポートをしてみませんか?