見出し画像

負の二項分布の期待値と分散

 いつものように期待値と分散を求めていきますが、前回の記事に書いたように負の二項分布は定義がいくつか存在するので、期待値や分散もそれらに対応するように導出されます。

まずは前回の記事で取り上げた負の二項分布を示します。

$$
P(X=k)=\dbinom{r+k-1}{k}p^r(1-p)^k\cdots(定義1)\\
P(X=m)=\dbinom{m-1}{r-1}p^r(1-p)^{m-r}\cdots(定義2)
$$

定義$${1}$$を「成功確率を$${p}$$として$${r}$$回成功するまでに$${k}$$回失敗する確率」、定義$${2}$$を「$${r}$$回成功するのに$${m}$$回試行する確率」として導出を進めます。期待値と分散はそれぞれ

$$
\begin{array}{cc}
定義1&定義2\\
E(X)=\dfrac{r(1-p)}{p} & E(X)=\dfrac{r}{p}\\
V(X)=\dfrac{r(1-p)}{p^2} & V(X)=\dfrac{r(1-p)}{p^2}\\
\end{array}
$$

期待値の導出

定義1

期待値の定義から攻めて、超幾何分布の時にも登場した「総和が1になる」が使える形を目指します。

$$
\begin{split}
E(X)&=\sum_{k=0}^{\infty} k\dbinom{r+k-1}{k}p^r(1-p)^k\\
&=\sum_{k=1}^{\infty} k\dfrac{(r+k-1)!}{k!(r-1)!}p^r(1-p)^k\\
&=\dfrac{r(1-p)}{p}\sum_{k=1}^{\infty} \dfrac{(r+k-1)!}{(k-1)!r!}p^{r+1}(1-p)^{k-1}\\
&=\dfrac{r(1-p)}{p}\sum_{k=1}^{\infty} \dbinom{r+k-1}{k-1}p^{r+1}(1-p)^{k-1}\\
&=\dfrac{r(1-p)}{p}
\end{split}
$$

定義2

同じ方針で導出します。

$$
\begin{split}
E(X)&=\sum_{m=0}^{\infty} m\dbinom{m-1}{r-1}p^r(1-p)^{m-r}\\
&=\sum_{m=1}^{\infty} m\dfrac{(m-1)!}{(r-1)!(m-r)!}p^r(1-p)^{m-r}\\
&=\dfrac{r}{p}\sum_{m=1}^{\infty} \dfrac{m!}{r!(m-r)!}p^{r+1}(1-p)^{m-r}\\
&=\dfrac{r}{p}\sum_{m=1}^{\infty}\dbinom{m}{r}p^{r+1}(1-p)^{m-r}\\
&=\dfrac{r}{p}
\end{split}
$$

ここで、定義$${1}$$は「$${r}$$回成功するまでに$${k}$$回失敗する確率」で、失敗回数の$${k}$$に成功回数の$${r}$$を足すと全体の回数$${m}$$になる。また定義$${2}$$の場合は「$${r}$$回成功するのに$${m}$$回試行する確率」なので、定義$${1}$$の期待値(失敗回数の平均値)に成功回数を足すと

$$
=\dfrac{r(1-p)}{p}+r=\dfrac{r}{p}
$$

となって定義$${2}$$の期待値に一致する。さらに、定義$${2}$$において$${r=1}$$のとき、幾何分布の期待値と一致することが分かります。

分散の導出

定義1

いつもと同様に$${V(X)=E(X(X-1))+E(X)-(E(X))^2}$$を使って導出するので$${E(X(X-1))}$$を求めていきます。途中の式変形が複雑ですが、結局は負の二項分布の形になるように辻褄合わせをしているだけです。

$$
\begin{split}
E(X(X-1))&=\sum_{k=0}^{\infty}k(k-1)\dbinom{r+k-1}{k}p^r(1-p)^k\\
&=\sum_{k=0}^{\infty}k(k-1)\dfrac{(r+k-1)!}{k!(r-1)!}p^r(1-p)^k\\
&=\dfrac{r(r+1)(1-p)^2}{p^2}\sum_{k=2}^{\infty}\dfrac{(r+k-1)!}{(k-2)!(r+1)!}p^{r+2}(1-p)^{k-2}\\
&=\dfrac{r(r+1)(1-p)^2}{p^2}\sum_{k=2}^{\infty}\dbinom{r+k-1}{k-2}p^{r+2}(1-p)^{k-2}\\
&=\dfrac{r(r+1)(1-p)^2}{p^2}
\end{split}
$$

よって分散は

$$
\begin{split}
V(X)&=E(X(X-1))+E(X)-(E(X))^2\\
&=\dfrac{r(r+1)(1-p)^2}{p^2}+\dfrac{r(1-p)}{p}-\Bigl(\dfrac{r(1-p)}{p}\Bigl)^2\\
&=\dfrac{r(1-p)}{p^2}\Bigl( (r+1)(1-p)+p-r(1-p)\Bigl)\\
&=\dfrac{r(1-p)}{p^2}
\end{split}
$$

定義2

同じ方向から導出します。

$$
\begin{split}
E(X(X-1))&=\sum_{m=0}^{\infty}m(m-1)\dbinom{m+1}{r-1}p^r(1-p)^{m-r}\\
&=\sum_{m=0}^{\infty}m(m-1)\dfrac{(m-1)!}{(r-1)!(m-r)!}p^r(1-p)^{m-r}\\
&=\sum_{m=0}^{\infty}m\Bigl\{(m+1)-2\Bigl\}\dfrac{(m-1)!}{(r-1)!(m-r)!}p^r(1-p)^{m-r}\\
&=\sum_{m=0}^{\infty}m(m+1)\dfrac{(m-1)!}{(r-1)!(m-r)!}p^r(1-p)^{m-r}-2\sum_{m=0}^{\infty}m\dfrac{(m-1)!}{(r-1)!(m-r)!}p^r(1-p)^{m-r}\\
&=\dfrac{r(r+1)}{p^2}\sum_{m=0}^{\infty}\dfrac{(m+1)!}{(r+1)!(m-r)!}p^{r+2}(1-p)^{m-r}-2E(X)\\
&=\dfrac{r(r+1)}{p^2}\sum_{m=0}^{\infty}\dbinom{m+1}{r+1}p^{r+2}(1-p)^{m-r}-2E(X)\\
&=\dfrac{r(r+1)}{p^2}-2E(X)
\end{split}
$$

よって分散は

$$
\begin{split}
V(X)&=E(X(X-1))+E(X)-(E(X))^2\\
&=\dfrac{r(r+1)}{p^2}-\dfrac{r}{p}-\Bigl(\dfrac{r}{p}\Bigl)^2\\
&=\dfrac{r(1-p)}{p^2}
\end{split}
$$

定義1と定義2の分散は同じになることが分かります。期待値計算のところで触れましたが、成功回数分$${r}$$を足しただけなので分散自体に変化がないのは直感的にも正しいですね。

参考


この記事が気に入ったらサポートをしてみませんか?