見出し画像

最尤推定量が少しわかってきた気がする

毎週、すうがくぶんかの先生たちに統計学を教えてもらっています。今、統計検定の準一級をターゲットに(幸運にも、いやいや残念ながら6月の検定が中止になってしまったので、(来年がんばります))、数理統計をじっくり勉強しています。

統計検定の2級と比べて、段違いに難しくなってきているのですが、そこで出てきた最尤推定量の話が、なんかやっと腑に落ちてきたのでメモを残しておきたいと思います。

統計とはそもそも何か

かなり乱暴に言うと、統計学って、

・世の中の多くは確率で決まる。(確率分布の中で起きている)。
 一定の起きやすさにランダム要素が加わっている

・あらゆるパターンを考えると大変なので、確率分布を考えやすいように過去の偉人たちによる確率分布のパターン(正規分布とかガンマ分布とか)に沿ってかんがえることで、その母数(パラメーター、母集団のパラメータとかいう)に集中すれば、分布が分かる。※1

・母数はヒカルの碁でいう神の一手(絶対に到達できない領域なんで)なので、サンプルという実観測データからこれくらいの確率でそれに近づけるための値を母数と考えるところまででおさめる。 

最尤推定とは

うえの神の一手てきな、母数のパラメータに一番、それっぽい値のことです。実データ(サンプル)をもとにした、それっぽい確率分布の母数を推定することです。(1点にしぼったり(点推定)、範囲で答えたり(区間推定)

なので、サンプルが変われば、最尤推定量も変わります。

どうやって判断するの?

ここは、今回はざっくりおまけ程度です。(ちゃんと教科書を読んで、手を動かした方がいい。)

尤度関数というものを作り、その最大化問題を解くというところがポイントです。
i.i.d. (independently and identically distribution (取得したデータがそれぞれ、独立かつ同一の分布から取得されたもの。響きがかっこよくないですか?)であれば、この同一の確率分布の確率密度関数の積が尤度関数になります。

サンプル数分の掛け算になるので、対数を取るとデータの数分の足し算に変換できるのでこちらを微分していきます。(この1次微分の関数をスコア関数と呼ぶ)

スコア関数が0になる点(準1級では基本1つしかないっぽい)を探すとその時のパラメータが今回のデータにとっては最尤推定量になり、一番今回のデータが得やすい母数のパラメーターになります。

まとめ

・統計学は、神の一手(母集団の分布を知る。ひいては母数のパラメータ)を目指すための学問である。
・その方法として今ある手段(サンプルデータを)もとに、一番それっぽい値を計算する。この値が最尤推定量(一番それっぽいパラメータの値)という
・方法は頑張る。(対数とか微分とか盛沢山。数学ガンバろう。)


最後に、

統計学の級が上がるごとに徐々に抽象度が上がるというか、どんな状況でも考えられるための武器が増えていくイメージです。実はこれを勉強するとなんとなく暗記で覚えていた2級の範囲も、理解が深まることがちょいちょいあります。

※1 かなり雑に話しましたが、これはパラメトリック統計学という種類で、ノンパラメトリック統計学という母数(パラメーター)を特定せずに分布を推定する方法もあります。 

ここまで読んでいただきありがとうございます。 スキを押していただけると嬉しいです。 フォローしていただけるとさらにうれしいです。