見出し画像

データサイエンス技術書「データ解析のための統計モデリング入門」

はじめに

こんにちは、なかなです。

今回は 久保 拓弥 著「データ解析のための統計モデリング入門――一般化線形モデル・階層ベイズモデル・MCMC」の紹介です。

統計モデリングに関する入門書としてめちゃくちゃ有名ですよね。通称緑本と呼ばれていて知っている人も多いのでは。

世の中に解説記事がたくさん溢れている本なのでこの記事では

- どんな人におすすめか
- どんなところが良かったか
- おすすめの参考記事

を紹介したいと思います。

最初はすごい難しそうな本だなと思って懸命していたのですが実際に読んでみると数式がゴリゴリ出てくるようなタイプの本ではありませんでした。

実際の例題を通して解析や分析の方法を学んでいくスタイルでその方法には納得感がある流れであったので、サクサクすすめます。

例えばですが、

- 正規分布じゃなくてポアソン分布でモデリングするのは何で?
- 一般化線形モデルと線形回帰ってどう違うの?
- マルコフ連鎖モンテカルロってどんな操作をしているの?

といった疑問に対して非常にすっきり説明してくれています。

必要最低限の数式で統計のイメージを掴むことを目的としており、非常に読みやすかったです。自分は大体この本の内容を理解するのに15~20時間ほどかかりました。

こんな人におすすめ

- 統計、検定、最尤推定の意味があやふやな初学者
- 一般化線形モデルについて詳しく知りたい人
- 状態空間モデルのさわりだけを知りたい人

こんな人には別の本がおすすめ

pythonを使った状態空間モデルがやりたい

良かったところ

1つ目はこの本に関するブログ記事などが非常に多いことです。ですので仮にないようで分からないところがあったとしても、ブログ記事を読めば分かったなどということが往々にしてあります。

例えば本ではwinbugと呼ばれる言語が使われているのですが、pythonとstanで実装した例を示す記事などが世の中にたくさんあります。実際に私も Python を使っているので、これらの記事を参考にしながら読み進めていました。

2つ目は実例を通じた解説に終始している点です。統計の本によくありがちな、正規分布やポアソン分布の説明などがどんどん出てきてそれらが消化できずに飽きてしまうといったことは全くありません。 必要に応じてそれらのベルトの説明がさらっと出てくるスタイルです。

実際の例を通して分数の説明をしてくれるのでイメージも湧きやすいです。

マイナスだったところ

Python を使って実装する場合細かい解説は当然ありません。 コード自体は後でも紹介する通り有志の方が公開していただいてます。正しい行動の中に非常に細かい解説などがあるわけではありません。

一般化線形モデルの部分なのは普通のPythonの知識があればある程度理解できるのですが、特に自分が苦労したのはstanでの状態空間モデルの実装です。

stanはC++をベースにしたコードになっており、自分の場合はどの変数がどういう風に作用しているのか理解するのに結構時間がかかってしまいました。

状態空間モデルの学習は主な目的の方は、この辺りの解説があるような本を選んだ方が無難です。

下記の本は初心者向けなのでゴリゴリ数式が載っているようなタイプではなく何もイメージを重視した読みやすい本になっています。 緑本を読んでいなくても、理解できる内容なのでご安心ください。

時系列分析の目的であればこちらの本がおすすめ。

stanを用いた実装が主な目的であればこちらの本がおすすめ。

おすすめ参考記事

Pythonで実装しながら緑本を学ぶ
https://ohke.hateblo.jp/archive/category/%E7%B5%B1%E8%A8%88%E5%AD%A6

自分がもっとも参考にさせて頂いたサイトです。本の内容をpythonを用いて実装されています。正直このような返事がなければ私もこの本を読み進めることができなかったと思います。この場を借りてお礼申し上げたいです。本当にありがとうございます。

統計の勉強に最適な緑本こと「データ解析のための統計モデリング入門」を紹介
https://www.hellocybernetics.tech/entry/2018/10/23/212425

どんなことが書いてある本かを知りたい場合はこの記事を読むとわかります。各章に関して完結にまとまっています。


【読後メモ】データ解析のための統計モデリング入門(その1)
https://learning-with-machine.hatenablog.com/entry/2019/02/22/010000

こちらの記事では、それぞれの章に関して、それなりのボリュームをもたせて、わかりやすくまとめています。本を読んだ後にこの記事を読むと内容がまとまります。

この記事が気に入ったらサポートをしてみませんか?