超幾何分布

はじめに

先日また友人とAPEXをやってるときに友人から聞いた分布を、得意な数理処理で扱ってみたという記事.
超幾何分布の期待値までは計算が楽になったよ.
それでもやっぱり分散は大変だったよ.

定義

2種の排他的属性に分割できる有限母集団からの非復元抽出

https://ja.wikipedia.org/wiki/%E8%B6%85%E5%B9%BE%E4%BD%95%E5%88%86%E5%B8%83

則ち、赤玉$${K}$$個、白玉$${N-K}$$個が入った袋から、同時に$${n}$$個取り出すとき、赤玉を$${k}$$個引く確率分布を考えればよい.

$$
P(k)
=
A
\begin{pmatrix}K\\k\end{pmatrix}
\begin{pmatrix}N-K\\n-k\end{pmatrix},
$$

ここで$${A}$$は規格化係数.

moment母函数を考える

本章では私の思考順序も込みで記す.
結論のみが知りたい場合は, 章末の式の展開をして確かめるのが速かろう.

二項係数であることから、まずは安直に多項式の係数を考えてみる.

$$
\begin{pmatrix}K\\k\end{pmatrix}
\begin{pmatrix}N-K\\n-k\end{pmatrix}
=
(1+x)^K(1+y)^{N-K}[x^ky^{n-k}],
$$

ここで$${f(x)[x^k]}$$は多項式$${f(x)}$$の$${x^k}$$次の項の係数を意味する.

moment母函数$${M(t):=E[\mathrm e^{tk}]}$$は

$$
M(t)
=
\sum_{k=0}^K\mathrm{e}^{kt}P(k)
=
\sum_{k=0}^K\mathrm{e}^{kt}A\left((1+x)^K(1+y)^{N-K}[x^ky^{n-k}]\right)
$$

さて, $${\mathrm e^{kt}}$$をどこに組み込むか.
ここでしょ.

$$
M(t)
=
\sum_{k=0}^KA(1+\mathrm{e}^tx)^K(1+y)^{N-K}[x^ky^{n-k}]
$$

また$${x,y}$$の次数の和が$${n}$$であることを考えるとズバリ

$$
M(t)
=
A(1+\mathrm{e}^tx)^K(1+x)^{N-K}[x^n]
$$

momentを計算する

momentとmoment母函数の関係

常識だが説明してこなかったが, ここで確認しておこう.
moment母函数の$${t=0}$$における微係数を考えると,

$$
\left.\frac{\partial^iM}{\partial t^i}\right|_{t=0}
=
\left.E\left[\frac{\partial^i}{\partial t^i}\mathrm e^{tx}\right]\right|_{t=0}
=
\left.E\left[x^i\mathrm e^{tx}\right]\right|_{t=0}
=
E\left[x^i\right]
=
m_i
$$

0次 - 規格化条件

$$
m_0
=
M(0)
=
A(1+x)^N[x^n]
=
A\begin{pmatrix}N\\n\end{pmatrix}.
$$

$${m_0=1}$$より$${A=\frac1{\begin{pmatrix}N\\n\end{pmatrix}}}$$.

1次 - 期待値

$$
\begin{array}{rcl}\displaystyle
m_1
&=&\displaystyle
\frac{\partial M}{\partial t}(0)
\\&=&\displaystyle
\left.A\mathrm{e}^txK(1+\mathrm{e}^tx)^{K-1}(1+x)^{N-K}[x^n]\right|_{t=0}
\\&=&\displaystyle
AxK(1+x)^{N-1}[x^n]
\\&=&\displaystyle
AK(1+x)^{N-1}[x^{n-1}]
\\&=&\displaystyle
\frac{K\begin{pmatrix}N-1\\n-1\end{pmatrix}}{\begin{pmatrix}N\\n\end{pmatrix}}
\\&=&\displaystyle
\frac{Kn}N
\end{array}
$$

$${m_1=\mu}$$より$${\mu=\frac{Kn}N}$$


2次 - 分散

$$
m_2
\hspace{300px}\\=
\frac{\partial^2 M}{\partial t^2}(0)
\hspace{300px}\\=
\left.
A\left(\mathrm{e}^txK(1+\mathrm{e}^tx)^{K-1}
+(\mathrm{e}^tx)^2K(K-1)(1+\mathrm{e}^tx)^{K-2}\right)(1+x)^{N-K}[x^n]
\right|_{t=0}
\\=
A\left(xK(1+x)^{K-1}
+x^2K(K-1)(1+x)^{K-2}\right)(1+x)^{N-K}[x^n]
\hspace{100px}
\\=
A(xK+x^2K^2)(1+x)^{N-2}[x^n]
\hspace{200px}\\=
AK(1+x)^{N-2}[x^{n-1}]+AK^2(1+x)^{N-2}[x^{n-2}]
\hspace{150px}
\\=
\frac{K\begin{pmatrix}N-2\\n-1\end{pmatrix}+K^2\begin{pmatrix}N-2\\n-2\end{pmatrix}}{\begin{pmatrix}N\\n\end{pmatrix}}
\hspace{200px}
\\=
\frac{Kn(N-n)}{N(N-1)}+\frac{K^2n(n-1)}{N(N-1)}
\hspace{200px}
$$

$${\sigma^2=m_2-m_1^2}$$より

$$
\sigma^2
\hspace{300px}
\\=
\frac{Kn(N-n)}{N(N-1)}+\frac{K^2n(n-1)}{N(N-1)}-\frac{K^2n^2}{N^2}
\hspace{180px}
\\=
\frac{Kn}{N^2(N-1)}\left[N(N-n)+NK(n-1)-Kn(N-1)\right]
\hspace{100px}
\\=
\frac{Kn}{N^2(N-1)}\left[N(N-n)+K(N-n)\right]
\hspace{200px}
\\=
\frac{Kn(N-K)(N-n)}{N^2(N-1)}
\hspace{250px}
$$

この記事が気に入ったらサポートをしてみませんか?