負の二項分布に従う確率変数の期待値と分散、モーメントと幾何分布

負の二項分布

成功確率が$${p}$$の試行で$${k}$$回の成功を得るまでの失敗の回数$${x}$$が従う確率分布を負の二項分布呼ぶ。
$${k+x}$$回で$${k}$$回成功しているから、$${k+x-1}$$回中の$${x}$$回失敗の組み合わせは、$${{}_{k+x=1}C_x}$$であるから、確率密度関数は、
$${f(x)={}_{k+x-1}C_xp^k(1-p)^x}$$と与えられる。
$${{}_rC_x}$$は$${r<0}$$に拡張できて、
$${{}_{-r}C_x=\displaystyle{\frac{(-r-x+1)(-r-x+2)\cdots(-r-1)(-r)}{x(x-1)\cdots2 \cdot 1}}}$$
これを用いて、
$${f(x)={}_{k+x-1}C_xp^k(1-p)^x=\displaystyle{\frac{(k+x-1)(k+x-2)\cdots k}{x(x-1)\cdots2 \cdot 1}p^k(1-p)^x}}$$
$${=(-1)^x{}_{-k}C_xp^k(1-p)^x}$$となる。
また、二項定理$${\displaystyle{\sum_{x=0}^\infty {}_kC_xt^x=(1+t)^k}}$$を$${k<0}$$に拡張した、$${\displaystyle{\sum_{x=0}^\infty {}_{-k}C_xt^x=(1+t)^{-k}}}$$を用いて、
$${\displaystyle{\sum_{x=0}^\infty f(x)=\sum_{x=0}^\infty(-1)^x{}_{-k}C_xp^k(1-p)^x=p^k\sum_{x=0}^\infty(-1)^x{}_{-k}C_x(1-p)^x}}$$
$${t=p-1}$$に置き換えて、
$${\displaystyle{\sum_{x=0}^\infty f(x)=p^k\sum_{x=0}^\infty(-1)^x{}_{-k}C_x(-t)^x=p^kp^{-k}=1}}$$が証明される。
モーメント母関数は、
$${M_x(t)=E[e^{tx}]=\displaystyle{\sum_{x=0}^\infty e^{tx}{}_{-k}C_xp^k(1-p)^x(-1)^x=p^k\sum_{x=0}^\infty {}_{-k}C_x(e^t(p-1))^x}}$$
$${t=e^t(p-1)}$$に置き換えて二項定理を使えば、
$${M_x(t)=p^k(1-e^t(1-p))^{-k}=\displaystyle{\Big(\frac{p}{1-(1-p)e^t}\Big)^k}}$$
これからモーメント$${\mu_1}$$、$${\mu_2}$$を求めて期待値と分散が以下のように求められる。
$${E[x]=\mu_1=\displaystyle{\frac{dM_x(t)}{dt}\Big|_{t=0}}}$$

$${\displaystyle{=kp^p(1-p)e^t(1-e^t(1-p))^{-k-1}|_{t=0}=\frac{kp^k(1-p)}{p^{k+1}}=\frac{k(1-p)}{p} }}$$

$${\mu_2=\displaystyle{\frac{d^2M_x(t)}{dt^2}\Big|_{t=0}}}$$

$${\displaystyle{=\Big(kp^k(1-p)e^t(1-(1-p)e^t)^{-k-1} +k(k+1)p^k(1-p)e^t }}$$

$${\displaystyle{+ (1-p)e^t(1-(1-p)e^t)^{-k-2}\Big)\Big|_{t=0}}}$$

$${\displaystyle{= kp^k(1-p)p^{-k-1}+k(k+1)p^k(1-p)^2p^{-k-2})}}$$

$${\displaystyle{=\frac{k(1-p)}{p}+\frac{k(k+1)(1-p)^2}{p^2}}}$$

$${\displaystyle{V[x]=\mu_2-\mu_1^2=\frac{k(1-p)}{p}+\frac{k(k+1)(1-p)^2}{p^2}- \frac{k^2(1-p)^2}{p^2}}}$$

$${\displaystyle{= \frac{k(1-p)}{p}+\frac{k(1-p)^2}{p}=\frac{k(1-p)}{p^2}}}$$

幾何分布

負の二項分布において、初めて成功するまでの失敗の回数$${x}$$が従う確率分布のことである。
$${k=1}$$であるから、
$${f(x)=p(1-p)^x}$$

$${M_x(t)=\displaystyle{\frac{p}{1-(1-p)e^t}}}$$

$${E[x]=\displaystyle{\frac{1-p}{p}}}$$

$${V[x]=\displaystyle{\frac{1-p}{p^2}}}$$

この負の二項分布に従う乱数は、pythonで、numpy.random.negative_binominalで実装できる。ここでは、以前の二項分布に従う確率変数と同様に、成功する確率は$${p=0.5, 0.3}$$とし、10000回の試行で、100回成功するまでに失敗する回数を示している。

import numpy as np
from numpy import random as rand
import matplotlib.pyplot as plt
rand.seed(0)

numt=100
tnum=10000
p=0.5
bi1 = rand.negative_binomial(numt,p,tnum)
p=0.3
bi2 = rand.negative_binomial(numt,p,tnum)
plt.hist(bi1, bins=100,label='p=0.5')
plt.hist(bi2,bins=100,label='p=0.3')
plt.title('negative_binominal')
plt.ylabel('Probability')
plt.xlabel('Data')
plt.legend();

この記事が気に入ったらサポートをしてみませんか?