見出し画像

【2回目】100日後にベイズ統計ができるゆーみん【19日目】

おはようございます!

今日もちょっとだけ進めていきますよ〜

5.2.3 メカニズムの想像

今回のデータは重回帰だとちょっとまずいのです。
なぜならば出席率の実測値がほぼ1であるデータがいくつかあるため、説明変数の組み合わせによっては出席率の予測値が1を超えてしまいます。

この場合は説明変数の線形結合(b1+b2A+b3Score)を、(0,1) の範囲に変換します。方法はロジスティック関数1/{1+exp(-x)}を使って変換します。Stanではinv_logit関数が用意されてるのでそれを使います。

また今回は変換後の値に正規分布に従うノイズが加わるとすると、再び(0,1) の範囲を逸脱してしまいます。しかも、今回のデータでは、出席率の分母にあたる授業回数が12~88と比較的小さいので、出席率を連続値と見做すのは難しいと。
そこで、二項分布を使います!

まとめると、出席率は出席確率と解釈できるので、AとScoreの2つの説明変数の線形結合(b1+b2A+b3Score)をロジスティック関数で(0,1) の範囲に変換して出席確率pを決めます。そしてMとpをパラメータとする二項分布に従ってYが生成されたと考えます。

5.2.4 モデル式の記述

q[n] = inv_logit(b1+b2A[n]+b3Score[n])          n=1,...,N

Y[n] ~ Binomial(M[n], q[n])          n=1,...,N

Nは学生の人数で、nは学生のインデックス
Binomialは二項分布を表す。

データからb1, b2, b3を推定していきます!

今日はここまでです!
今日こそ今日中アップ(矛盾)をしたいものです...

では、また明日お会いしましょう〜

この記事が気に入ったらサポートをしてみませんか?