見出し画像

標準正規分布の裾確率

abstract 標準正規分布の裾確率を抑える不等式を導出します。このような不等式はいくつかありますが、今回はMills比に関連したものを紹介します。


1 Introduction

確率変数 $${X}$$ がある値以上を取る確率 $${\mathbb{P}[X>x]}$$ を裾確率といいます。裾確率は確率分布の裾の重さを表す重要な指標で、統計学や機械学習の理論の様々な場面で用いられています。また生存時間分析では生存関数と呼ばれ、それ自体が分析の対象になります。

このnoteでは、そのなかでも特に重要な標準正規分布の裾確率を計算します。

2 標準正規分布の裾確率

標準正規分布は以下のような確率密度関数で定義される確率分布でした。

$$
\begin{align*}
\phi(z) &= \frac{1}{\sqrt{2\pi}}\exp\left[-\frac{1}{2}z^2\right]
\end{align*}
$$

この関数 $${\phi(z)}$$ を用いて標準正規分布の裾確率は次のように評価することができます。

定理 以下の不等式が成り立ちます。

$$
\begin{align*}
\left(\frac{1}{z}-\frac{1}{z^3}\right)\phi(z)\leq \mathbb{P}[Z>z]\leq \frac{1}{z}\phi(z)
\end{align*}
$$

3 証明

3.1 準備

証明するにあたって、標準正規分布の確率密度関数が $${\phi'(z)=-z\phi(z)}$$ を満たすことが役に立ちます。実際、$${\displaystyle w=-\frac{1}{2}z^2}$$ と置いて合成関数の微分公式を用いると、

$$
\begin{align*}
\phi'(z) &= \frac{dw}{dz}\frac{d}{dw}\left(\frac{1}{\sqrt{2\pi}}\exp w\right)\\
&=-z\times\frac{1}{\sqrt{2\pi}}\exp w\\
&=-z\times\frac{1}{\sqrt{2\pi}}\exp\left[-\frac{1}{2}z^2\right]\\
&= -z\phi(z)
\end{align*}
$$

が得られます。

3.2 右辺の不等式の証明

右辺 $${\displaystyle \mathbb{P}[Z>z]\leq \frac{1}{z}\phi(z)}$$ を示します。部分積分を用いると、

$$
\begin{align*}
\mathbb{P}[Z>z] &= \int_{z}^{\infty}\phi(t)dt\\
&= -\int_{z}^{\infty}\frac{\phi'(t)}{t}dt\\
&= \left[-\frac{\phi(t)}{t}\right]_{z}^{\infty} - \int_{z}^{\infty}\frac{\phi(t)}{t^2}dt\\
&= \frac{1}{z}\phi(z) - \int_{z}^{\infty}\frac{\phi(t)}{t^2}dt\\
\end{align*}
$$

第二項は積分の中身が正の値しか取らない関数なので、積分の値も正になります。従って、右辺の不等式が従います。

3.3 左辺の不等式の証明

左辺の不等式 $${\displaystyle \mathbb{P}[Z>z]\geq \left(\frac{1}{z}-\frac{1}{z^3}\right)\phi(z)}$$ を示します。3.2節で、以下の等式を得ていました。

$$
\begin{align*}
\mathbb{P}[Z>z] &= \frac{\phi(z)}{z} - \int_{z}^{\infty}\frac{\phi(t)}{t^2}dt
\end{align*}
$$

第二項に対して部分積分を行い、等式変形を進めていきます。

$$
\begin{align*}
\int_{z}^{\infty}\frac{\phi(t)}{t^2}dt &= -\int_{z}^{\infty}\frac{\phi'(t)}{t^3}dt\\
&= \left[-\frac{\phi(t)}{t^3}\right]_{z}^{\infty}-3\int_{z}^{\infty}\frac{\phi(t)}{t^4}dt\\
&= \frac{\phi(z)}{z^3}-3\int_{z}^{\infty}\frac{\phi(t)}{t^4}dt
\end{align*}
$$

これを最初の等式に代入すると、以下の等式を得ます。

$$
\begin{align*}
\mathbb{P}[Z>z] &= \frac{\phi(z)}{z} - \frac{\phi(z)}{z^3} + 3\int_{z}^{\infty}\frac{\phi(t)}{t^4}dt
\end{align*}
$$

第三項は積分の中身が正の値しか取らない関数なので、積分の値も正になります。従って、左辺の不等式が従います。

Appendix 標準正規分布のMills比

累積分布関数 $${F(x)}$$ と確率密度関数 $${f(x)}$$ の比

$$
\begin{align*}
m(x) &= \frac{1-F(x)}{f(x)}
\end{align*}
$$

Mills比といいます。第2節の定理は、標準正規分布のMills比を評価した不等式として言い換えることができます。具体的には以下のようになります。ただし、$${\Phi(z)}$$ は標準正規分布の累積分布関数です。

$$
\begin{align*}
\frac{1}{z}-\frac{1}{z^3} \leq \frac{1-\Phi(z)}{\phi(z)} \leq \frac{1}{z}
\end{align*}
$$

Acknowledgement

日頃からサポートしていただいている方々、株式会社すうがくぶんかの皆さんに感謝申し上げます。

サポートをいただいた場合、新たに記事を書く際に勉強する書籍や筆記用具などを買うお金に使おうと思いますm(_ _)m