見出し画像

2変数の判別関数とマハラノビス距離

判別関数を1変数から2変数に拡張するときに
2変数の正規分布の式が出てくるので少し難しく感じる
そこで今回はなるべく途中式を省略せずに2変数の判別関数を導いていきたい


まず判別関数を導出するにあたって2変数の正規分布の確率密度関数とマハラノビス距離を確認する

2変数の正規分布

1変数正規分布の確率密度関数は

$$
f(x) = \frac{1}{\sqrt{2\pi\sigma^2}}exp(-\frac{1}{2}\frac{(x-\mu)^2}{\sigma^2})
$$

多変数になると分散の項に共分散の影響が出てくるので
分散共分散行列を$${\Sigma}$$として$${2}$$次元では

$$
f(x) = \frac{1}{\sqrt{(2\pi)^{2}|\Sigma|}}exp(-\frac{1}{2}(x-\mu)^T\Sigma^{-1}(x-\mu))
$$

この式の証明は下記が参考になる


マハラノビス距離

平均からの距離は2変数になると変数間でデータのスケールによってばらつきが出てしまうので、標準偏差で割って標準化する(変動係数みたいに)
これをマハラノビス距離と呼ぶ

$$
D^2 = (\frac{x-\mu}{\sigma})^2
$$

これを2変数に拡張すると
分散共分散行列を$${\Sigma}$$として

$$
D^2 = (x-\mu)^T\Sigma^{-1}(x-\mu)
$$

2変数の判別関数

正規分布に従う多変数の確率密度関数を下記のように設定する

$$
p_1 =   \frac{1}{\sqrt{(2\pi)^{2}|\Sigma_1|}}exp(-\frac{1}{2}(x-\mu_1)^T\Sigma^{-1}(x-\mu_1))
$$

$$
p_2 =   \frac{1}{\sqrt{(2\pi)^{2}|\Sigma_2|}}exp(-\frac{1}{2}(x-\mu_2)^T\Sigma^{-1}(x-\mu_2))
$$

これの対数比を取ると元々の指数部分がマハラノビス距離の形
$${D^2 = (x-\mu)^T\Sigma^{-1}(x-\mu)}$$になる

$$
log(\frac{p_1}{p_2}) = \frac{1}{2}log\frac{|\Sigma_2|}{|\Sigma_1|}
-\frac{1}{2}((x-\mu_1)^T\Sigma_1^{-1}(x-\mu_1) - (x-\mu_2)^T\Sigma_2^{-1}(x-\mu_2))
$$

1変数の場合

対数をとることができないので、指数部分の標準化した部分を
判別関数とする

$$
 (\frac{x-\mu}{\sigma})^2
$$

2変数の場合は確率密度関数の対数比を用いることで
マハラノビス距離が出てくる判別関数を導くことができた

またこの2次判別関数を展開すると下記のような
2次関数として表現することができる

$$
f(x) = x^TAx  + b^Tx +c
$$

$$
A = \frac{1}{2}(-\Sigma_1^{-1} + \Sigma_2^{-1})
\\
 b = \Sigma_1^{-1}\mu_1 - \Sigma_2^{-1}\mu_2
\\
 c = \frac{1}{2}(-\mu_1^T\Sigma_1^{-1}\mu_1 + \mu_2^T\Sigma_2^{-1}\mu_2)  + \frac{1}{2}log\frac{|\Sigma_2|}{|\Sigma_1|}
$$

この記事が気に入ったらサポートをしてみませんか?