![見出し画像](https://assets.st-note.com/production/uploads/images/134488234/rectangle_large_type_2_c9d2a6eea1c3f828dd09fec4196830e1.png?width=800)
統計準1級 第4章 変数変換 解説
変数変換とは
変数変換は、統計分析やデータ処理において、変数の値や性質を変更する手法
これによって、データの分析やモデルの構築が容易になったり、データの分布や関係性を改善したりすることが可能になる
変数変換にはいくつかの種類があるが今回は、1変数2変数の変数変換を紹介した後その他の変換について触れていく
1変数の変数変換による確率関数の変化
変数変換によって確率関数の$${dx}$$と積分区間が変化する
例 :
標準正規分布を
確率変数を$${X^2 \rightarrow Y}$$に変換したとする
$${dx}$$と$${dy}$$の関係式は
![](https://assets.st-note.com/img/1710878630190-l8I1NrxZnH.png)
積分区間について
$${x}$$が0以上以下で2分割し
第1項と第2項が等しいことを利用すると
![](https://assets.st-note.com/img/1710878908841-9hsAwHmu2B.png?width=800)
最終的に確率関数は以下の通りとなる
![](https://assets.st-note.com/img/1710878972622-qIuvl3yJU6.png?width=800)
また他の問題も下記取り上げる
![](https://assets.st-note.com/img/1710886011983-dKObZ6zGNV.png?width=800)
2変数の変数変換による確率関数の変化
2変数の変数変換も同様に確率関数の$${dx}$$と積分区間が変化する
1変数の場合は下記のように$${dx}$$が変化するが
$$
f_y(y) = f_x(x)\frac{\partial x}{\partial y}\\
{}\\
→ f_y(y)dy = f_x(x)dx
$$
2変数の場合は下記のように
確率関数の$${dx}$$を計算するときに
ヤコビアン$${|J|}$$を計算する必要がある
$$
f_x(x)f_y(y) = f_z(z) f_w(w) |J|\\
$$
において
$$
\begin{vmatrix}
\frac{\partial Z}{\partial X} & \frac{\partial Z}{\partial Y} \\{}\\
\frac{\partial W}{\partial X} & \frac{\partial W}{\partial Y}
\end{vmatrix}
= |J|
$$
ヤコビアンとは
2変数変換におけるヤコビアンとは
微小面積の変換前と変換後の面積比(Scale factor)である
例として半径3の円を極座標変換した場合を考えよう
極座標変換とは
円の$${x,y}$$を半径と角度の$${r, \theta}$$に変換することである
$${r}$$の範囲は円半径の範囲なので0から3
$${\theta}$$の半径は円が取りうる角度の範囲なので0から2 $${\pi}$$
これを図に表すと下図のようになる
![](https://assets.st-note.com/img/1710880823423-x6anjvYKT7.png?width=800)
ここで微小面積を白線で表すと変換した前と後で
面積の値が変わっていることに気がつくだろうか
例えば左の長方形の微小面積は一定だが、
右の円の微小面積は中心部が小さく、外側が大きい
この微小面積の変換前と変換後の面積比(Scale factor)を表したのが
ヤコビアンである!
ヤコビアンを使えば上の例$${r,\theta → x,y}$$だと
$$
dxdy = |J| drd\theta
$$
とい微小区間の面積の等式ができる
このときのヤコビアンは下記で求めることができる
$$
\begin{vmatrix}
\frac{\partial x}{\partial r} & \frac{\partial x}{\partial \theta} \\{}\\
\frac{\partial y}{\partial r} & \frac{\partial y}{\partial \theta}
\end{vmatrix}
$$
線型結合の2変数の変数変換における確率関数の変化
$${X,Y → Z,W where Z = aX + bY, W = Y}$$ の変換は
同時確率分布とヤコビアンを用いて
$$
f_x(x)f_y(y) = f_z(z) f_w(w) |J|\\
$$
ただし
$$
\begin{vmatrix}
\frac{\partial Z}{\partial X} & \frac{\partial Z}{\partial Y} \\{}\\
\frac{\partial W}{\partial X} & \frac{\partial W}{\partial Y}
\end{vmatrix}
= a (= |J|)
$$
となったのだった
これを両辺$${w}$$について積分すると$${\int_{-\infty}^{\infty} f_w(w)dw = 1}$$に注意して
$$
\int_{-\infty}^{\infty} f_x(x)f_y(y) \frac{1}{|J|}dw = f_z(z)
$$
$${(x,y) = (\frac{z}{a} - \frac{bw}{a},w)}$$を代入すると
$$
f_z(z) = \int_{-\infty}^{\infty} \frac{1}{|a|} f_x(\frac{z}{a} - \frac{bw}{a}) f_y(w)dw
$$
となる
これを用いて下記の問題を解いていこう
$${X,Y → Z,W where Z = aX + bY, W = Y}$$の
$${a = b = 1}$$の場合に該当することに注意
![](https://assets.st-note.com/img/1710888072741-i2Y7XTkaJn.png?width=800)
その他の変換
対数変換
対数変換$${y = logx}$$は非負値$${x}$$を正負無限大$${y}$$に変換するときに用いる
費用や価格、人口などの指数的に増加するデータの膨張を抑えるときに用いることが多く$${y = logx}$$の$${x}$$に代入する
![](https://assets.st-note.com/img/1710882489473-vkHB1b5gM0.png?width=800)
べき乗変換
べき乗変換$${y = x^a}$$は正負無限大$${x}$$を非負値$${y}$$に変換するときに用いる
対数変換とは逆に変化の少ないデータに対して膨張させたいときに用いる
![](https://assets.st-note.com/img/1710882960725-RfoAbHBgMQ.png?width=800)
ロジット変換
ロジット変換$${y = log \frac{x}{1-x}}$$は確率のような0から1をとる$${x}$$を正負無限大$${y}$$に変換するときに用いる
これの逆関数がロジスティック変換である
![](https://assets.st-note.com/img/1710885156929-EjLiiOwaBh.png)
プロビット変換
プロビット変換$${y = log \frac{x}{1-x}}$$は確率のような0から1をとる$${x}$$を正負無限大$${y}$$に変換するときに用いる
ロジット変換と同じようなことをしているが
プロビット変換の方が裾野の部分が狭いので
確率が0or1のように極端な値を取ることが少ないときに有用である
詳しくは下記
http://data-science.tokyo/ed/edj1-5-3-1-1.html
![](https://assets.st-note.com/img/1710885189123-A523xmZIq3.png)
この記事が気に入ったらサポートをしてみませんか?