見出し画像

確率変数の「和」「再生性」からの「畳み込み」、よく分からないお友達集まれ その1

 皆さんよくお集まりで。

よく分からない原因(推測)

「再生性」という用語は少し分かりにくい

 いきなり本題ですが、確率変数に再生性があると言っても標準正規分布-2$${\sigma}$$より左の端っこが齧られてなくなってもまた生えてくるという話、では全くないことは薄々気付いておられたことでしょう。

標準正規分布

 ふざけている訳ではありません。「分布の再生性」は、英語の reproductive property of distibution から来ているようで、確かに翻訳は1mmたりとも間違っていませんが、日本語で「再生」というと「(最近疑念が持たれるきらいのある)再生エネルギー」や、「トカゲの尻尾切り」や「山中教授のiPS細胞」みたいな「なくなったものがニュルっと生えてくる」みたいなのを連想してしまうのは私だけではなかろうと思います。

 再生性がある代表的な分布は正規分布とポアソン分布だそうですが、ここで言う再生性というのは、ざっくり言うと「二つの正規分布があって、それぞれの確率変数を足したものの確率分布もまた正規分布になる」という現象のことを言います。人間と人間が合体したら同じ人間が産まれる、猿が産まれるわけではないみたいな感じです。まあ再生と言えば再生ですね。
 一様分布なんかは合体したら全然違う生物を産み出しますので(後述)再生しない訳です。確率分布は猿パターンが普通みたいですね。

 個人的には、「再現性 reflexivity」「再帰性 reproducibility」みたいな方が分かりやすい気がするのですが、慣習なので仕方ない。こんなんばっかりや。

確率変数を「足す」ということが分かりにくい

 また、確率変数という「何が出るかは分からない」みたいなボヤッとしたものを足すという意味もよく分からない。
 2つの正規分布を足すと平均と分散はそのまま足せば良い、と言われても、ねえ、、、
 だってね、「関数を足す」なら、こんなのを思い浮かべますよね。

$$
f(x)=x^2,g(x)=x+1\\
f(x)+g(x)=x^2+x+1
$$

 でも今回のは全然違います。「変数を足す」のですから。残念。

 もう一つ、統計学では、一つ目の確率変数を$${X}$$、二つ目を$${Y}$$と大文字で表すことが多いようですが、これらは決してxy座標のことではありません。けど慣れ親しんだモノに引き摺られる悲しい人間のサガからxy座標に引っ張られてしまいます。これが分かりにくい原因のもう一つ。
 使える文字数が限られていて、アルファベットでは事足らず上に記号をつけたり(ダイアクリティカルマーク)、ギリシャ文字や果てはヘブライ文字א(アレフ)みたいなものの助けを借りている状況なので仕方ないのかもしれません。

「畳み込み」はビビる

 この再生性は、初心者向けの教科書では証明は端折られているようです。証明するには「畳み込みconvolution」と言う概念が必要になります。

 「畳み込み」、、、日本人ならまず押し入れを想像しませんか。

 少し知識をひけらかすと(全くよく分かってないですが)量子力学の繰り込み(無限大同士を無理やり引いてゼロにする結構力技だけど結果オーライと理解)や超弦理論の10次元のコンパクト化(究極物質候補の超弦super stringsは10次元で動くが我々の住む4次元以外の6次元はくるりと巻き取られて小さくなっているから心配しなくて大丈夫的な理解)を思い出しました。

 どちらにせよ、押し入れ以外は死ぬほど難しくてビビり倒すレベルの理論です。まあ、全く関係ないんですけどね。

 英語のconvolution(畳み込み)、ほぼこれは数学用語みたいですが、revolution(革命)とかrevolver(回転式拳銃)とかと同じvol的な部分は、ラテン語のconvolvere(con-共に, volvere回る、roll up巻き取る)みたいな意味です。言語学界隈ではクリシェ(頻出小話)みたいですが、車メーカー(元々ベアリングメーカー)のvolvo社の社名はラテン語で「私は回転する」という意味だそうです。

 何をもってconvoluteしているのか、命名者に会って問い詰めたいところですが、恐らく2つの変数を1つにまとめ上げる様子がconvoluteっぽかったのでしょうね。知らんけど。

 この後の説明では、「畳み込みって、なんだそれだけのことか」と言って貰えること請け合いです(予定)。

今回のあらすじ

 今回の記事の目的は、「なぜ2つの確率変数を足したものは元の平均と分散を足したものになる」のか、つまりは「再生性」がどうやって起こっているのか、それを「畳み込み」を使って納得していただくことにあります。
 あらすじは次の通りです。

  1. サイコロで「畳み込み」を説明する

  2. 組み合わせ(二項分布)$${_n C _k}$$で「再生性」を説明する

  3. ベクトルで「再生性」を説明する

  4. 積分で正規分布の再生性の計算を試してみる

 二項分布の成れの果て究極の姿が正規分布なので、感覚的には二項分布で十分掴めるものと思います。

長くなったのでその2に続く



この記事が気に入ったらサポートをしてみませんか?