見出し画像

数理統計学にハマってる

モチベーション

社会人になってから統計学というものを初めて学んで、割と最大級に好きなもののひとつだったのだが、最近ようやく!通読できた本があったので嬉しくて紹介しようと思った。あと、数理統計でのつまづきと、今後noteに書きたいことをぼんやりと考えたり、抱負とか考えたり、ホットなうちにメモっておこうと思った。
読んだ本はこれ「現代数理統計学の基礎」。

統計学へのモチベーション

社会人になってから機械学習(※AIのこと)に興味を持って、手法として結構統計学に近いところがあって、やろうと思った。ディープラーニングという今大成功を収めてる手法を使った機械学習はあまり数学的ではなくて、キモは(多分)誤差逆伝播法なのであるが、単なる高校で習うチェインルール(微分の公式)がその本質であり、数にものを言わせて大量のデータで微修正していこうという発想だと思っている。ただ、ディープラーニング以前はSVMという手法が最有力なひとつであり、突き詰めると統計学の回帰問題にぶち当たる。他には(機械)学習という面ではベイズ統計学がかなり近かった。
※ただし上記(機械学習に関して)は今現在私が思ってる雰囲気的理解なので、つまりテキトウであるので自分で味わった方が早いかもしれません。

本の内容

1部
確率、確率分布と期待値、代表的な確率分布、多次元確率変数の分布
2部
標本分布とその近似、統計的推定、統計的仮説検定、統計的区間推定
3部
線形回帰モデル、リスク最適性の理論、計算統計学の方法、確率過程

レベルとしては2部までは東大の3〜4年次の経済学部?でやってる内容、3部は院以上のレベルとなっているみたいである。
全体的に分かりやすいものの純粋に内容として難しく厳密である。
割と刊行されて早い段階で入手していて、最近やっと通読出来たと言ったが、次に話すつまづきポイントが解消されたら案外スラスラ理解できた。(ただし後半は言ってることを理解だけして証明で読んでないor読めてないやつも多い)

数理統計学のつまづきポイント

個人的にだが、数理統計学は一番最初が最も大切で恥ずかしいことにそれが何年もずっと分からなかった。
1、確率変数Xと実現値xの違い
2、確率変数Xと分布Fと確率密度関数fの絡み
3、期待値の定義
私はこれらをしっかりと(哲学を持って)理解することが最も重要であると考える。逆にこれらが分かった途端、非常に世界がクリアになった。
特に1が分からないのは致命的で、勉強を進めると統計学ではよくxがXにすり替わる(※と言っても破綻してる訳じゃない。数学的には完璧!)がすり替わる度に頭にはてなマークが一杯浮かぶ羽目になるだろう。典型的なのはベイズ統計学において事後分布として母数θを考えるときには同じ記号θを持ってして、実現値ではなく確率変数を表している、、が初めの一歩なのでこれが分からないということはドアを開けて「さあ!」と踏み出した瞬間目の前にあるのが崖であり、一直線に落下することになる。
ただし、これらが書いてあるのが最初の1、2章である!

今後の抱負

数学科を卒業したからなのか、どうしても「リスク最適性の理論」とか「確率過程」らへんを深めたいなあ、と考えてしまう。
しかし機械学習や、多変量解析付近のこともやりたいし、計量経済学もいいな、と思う。
後は大学とか大学院に入り直すとかも考えてるが、貧困なので難しいとも思う。
統計検定というものもどっかのタイミングで受けようかなあ、って思ってる。

note的な抱負としてはまず上の統計学の基礎中の基礎を本質的、数学的、哲学的に記事におこしたいと思う。なんのしがらみもない自分にしか書けないことがあると思う。

まとめ

結局長年読めてなかった本を完読できて嬉しいっていう報告がしたかっただけです。

スキ、コメント、シェア、フォローいただけると嬉しくてしょうがないです。ありがとうございました。

この記事が気に入ったらサポートをしてみませんか?