見出し画像

【物理数学】確率過程の定式化【確率論①】

ニュートンの運動方程式によって理解される運動というのは,空間が完全に空っぽであるという理想化が実は入っています.天体の運動なんかはその理想化が十分成り立ち,非常に規則的な運動として捉えることができます.しかしながら,そのような空間は実際にはどこにもなく,現実には多くの分子が飛び交う中を系は運動し,それらとの衝突によって運動はゆらぎます.したがって,何らかのゆらぎにさらされていない物理系は現実に存在しないといってよいでしょう.

ゆらぎに駆動されて,系の運動の軌道は細かく見ればみるほどジグザグが現れてくることになります.1827年に植物学者のブラウン(R. Brown)は水に浮かぶ花粉から流出した微粒子が不規則に,まるで生命を持つかのように運動するのを顕微鏡下に発見しました.ブラウン運動は当時としては原因不明でしたが,このブラウン運動こそが原子説の決定的な証拠となりました.アインシュタインの1905年の論文によりその理論が示され,ぺラン(Perrin)の1909年の実験によって確かめられたのでした.本記事のヘッダーの図は,ペランが顕微鏡を覗きながら水中に漂う乳香のコロイド粒子の位置を30秒毎に測定し線で結んで得られた記録です.

ブラウン運動のようにジグザグで微分できそうもないような経路をとる運動をどう扱ったら良いのでしょうか.ゆらぐ物理系の運動は確率的に記述するのがよい方法で,これが統計力学の根底にも流れている考え方です.物理量のランダムな時間変化のことを数学的に確率過程といいます.ここでは,確率過程を数学的に扱うための方法を整えておきましょう.

確率変数・確率過程の定義

確率過程を定義するために,まずは確率変数の定義を与えておく必要があります.確率変数(random variable)は標本空間から実数への写像

$$
\begin{align*}
X&: \Omega \to \mathbb{R}\\
(X&: \text{ 確率変数}\\
\Omega&: \text{ 標本空間}\\
\mathbb{R}&: \text{ 実数})\\
\end{align*}
$$

として定義されます.標本空間(sample space)とは確率が定義される基礎となる集合で,その部分集合を事象(event)といい,要素の一つ一つは根元事象(elementary event)といいます.普通のサイコロを投げて出た目を考えるのであれば,標本空間は

$$
\Omega = \{\text{1の目,\ 2の目,\ 3の目,\ 4の目,\ 5の目,\ 6の目} \}
$$

となります.根元事象は数値でなく何か抽象的なものでも構いません.
そして「根元事象を実数に対応させるもの」が確率変数の定義なので,「出た目の数字」とか「出た目の数字の二乗」などが確率変数として考えられます.

さて,確率変数に対応した実数は,実際にそのイベントが起こったときの確率変数の値を意味し,実現値(realization)と呼びます.多くの数学の本に倣って,この節では確率変数は大文字で,実現値は小文字で

$$
x := X(\omega)\\
\text{($\omega$ は根元事象)}
$$

で表すことにします.

確率変数の資格があるのは,可測関数(measurable function)だということを注意しておきます.数学的に少しやかましい定義をいうと,可測関数とは「任意の実数のボレル(Borel)集合を,考えている関数の逆写像によって移すと,それがシグマ加法族に属しているような関数」です.これを説明するために,まず,シグマ加法族というものを定義します.シグマ加法族の定義は

・標本空間それ自体と,空集合を,それぞれ事象として含む.
・ある事象とある事象について,それらの和集合,共通集合,差集合をまた事象として含む.
・可算無限個の事象の和集合も,また事象として含む.

という性質を満たすような,事象の集合です.これは確率が測れる集合をうまく定義しているのです.そして事象の確率を実際に測る関数は,確率測度(probability measure)といい,例えばある事象が起こる確率を測る写像を

$$
A \mapsto \mu(A) \in \mathbb{R} \ \ \ \
(A \text{ は事象,つまり} A\in \Omega)
$$

のように書きます.そして,実数のボレル集合とは,半閉区間

$$
(-\infty, x]
$$

の部分集合のすべてを含む最小のシグマ加法族のことです.これは数直線上のすべての開区間と閉区間を含みます.以上,少し衒学的だったかもしれませんが,要は可測関数とは,「ある実現値の原因となった事象の確率がきちんと測れるような関数」を意味しています.確率変数が可測関数であるおかげで,後で出てくる確率密度が定義できます

さて,本題の確率過程(stochastic process)とは,時間をパラメータとして確率変数を並べたものとして定義されます.つまり,確率過程は,時間$${t}$$をパラメータとする次のような写像

$$
X: \Omega \times t \to \mathbb{R}
$$

です.特に,根元事象を固定した

$$
X: t \to \mathbb{R}
$$

という写像は,ひとつの実現値の軌跡 (trajectory)$${x(t)}$$を与えます.


簡単な例としてやはり,サイコロを繰り返し振るときを考えてみましょう.ここではサイコロを振った回数を時間だと思ってください.あらゆる目の出方の系列を集めたものを標本空間にとります.たとえば10回振るときを考えれば6の10乗個,つまり約6千万個もの根元事象からなる空間になります.そして「サイコロを振った時に出た目の数字」などを写像にとればそれは確率過程です.根元事象である「目の出方の系列」をひとつに固定したとき,それは当然ながら実現値の時系列を表していて,これを軌跡と呼んでいるということになります.

また,ここまでただ一つだけ確率変数を考えてきましたが,確率変数の数を増やす拡張も考えられます.複数のサイコロを振る場合などがそれに当たります.

確率密度

サイコロでは普通,「どの根元事象も等しい確率で起こる」という確率測度を採用します.このように確率測度に具体的な形を与えると系の確率的な性質が決まることになります.公理論的な数学の本では天下り的にそうした確率測度の具体的な形を導入してから得られる結果について議論を進めることでしょうが,物理的な運動を考察していくにあたっては,むしろ運動を観測するところから確率測度の具体的な形を決めていくという筋道をとりたいところです.ただし,確率であるからには,各事象について確率は負にならず,全事象についての確率は1になり,また排反な事象についての確率は足し算できるといった性質を,確率測度は前提として満たしていなければなりません.

確率測度の具体的な形と言いましたが,それは普通,実現値を測定することによって推察されるものでしょう.よって,根元事象よりも実現値の方から確率を測る方が自然です.そのために,確率密度というものを次のように導入します.

確率変数について考えます.その確率変数に関連する確率密度(probability density)$${f_X(x) dx}$$を次の式によって定義します:

$$
f_X(x) dx = \mu(\{\omega \in \Omega \mid x < X(\omega) \leq x + dx \})
$$

つまり,確率変数の実現値が$${(x,x+dx]}$$の間に入る確率が,「確率密度かける実現値の幅」になるように定義します.確率の分布が確率密度によって表現されますので,物理のテキストでは確率分布とも呼ばれます.実現値が連続な場合は,幅を持たせないと確率は$${0}$$になってしまうので,微小な幅を持たせているのです.(注:確率が$${0}$$だからといって存在しないわけではありません.また,離散的な場合はこのような幅はいりません.ただし,離散的な場合もデルタ関数の和で書けばよいので,連続な場合だけを考えることにします.)


では,確率過程について考えます.この場合は軌跡ごとの確率密度を考えましょう.つまり,いくつかの時点

$$
t_1, t_2, \ldots, t_n
$$

で観測したときに,実現値がそれぞれ

$$
(x_1, x_1+dx_1], (x_2, x_2 + dx_2], \ldots, (x_n, x_n +dx_n]
$$

の間に入る確率を,

$$
\begin{align*}
&f_X(x_n,t_n;\cdots;x_1,t_1) dx_n\cdots dx_1\\
&=\mu(\{\omega\in\Omega, t_j \in t \mid x_j < X(\omega, t_j) \leq x_j + dx_j, j= 1,\ldots,n\})
\end{align*}
$$

によって定義される同時確率密度(joint probability density)で表します.時間を離散的でなく,連続なものとして考えるには,観測する時刻を無限に細かくしたすべての時点についてこの確率分布が与えられて,軌跡の汎関数で表現できるでしょうが,測度をここに導入することは数学的に簡単ではありません.物理的にも,測定は普通離散的な時間に対して行われるので,離散的な時間について考える方が現実に即していると思います.

軌跡全体を考えるのでなく,ある時刻に限定したときにある実現値をとる確率を考えることもあります.それには上の同時確率密度を,着目していない時刻での確率変数について和をとった

$$
f_X(x_i,t_i) = \int f_X(x_n,t_n;\cdots;x_1,t_1) dx_n\cdots dx_{i+1} dx_{i-1} \cdots dx_1
$$

を考えればよい.この和をとる操作を周辺化(marginalization)といいます.

プロパゲータ

私たちが観測をするときというのは,事前に準備をしたうえで,その後状態がどう変化するかを見るということです.したがって,測定で得られる情報とは本質的に条件付き確率で与えられます.そこで,プロパゲータというものが重要になります.

ある時刻に系の実現値を観測したとしましょう.その実現値および時刻を

$$
x_0, t_0
$$

と書くことにします.その条件のもとで,のちの時刻

$$
t_1, t_2, \ldots, t_n
$$

において実現値がそれぞれ

$$
(x_1, x_1+dx_1], (x_2, x_2 + dx_2], \ldots, (x_n, x_n +dx_n]
$$

の範囲に入る,そんな条件付き確率は

$$
P(x_n,t_n; \cdots; x_1, t_1 \mid x_0,t_0) dx_n\cdots dx_1 = \frac{f(x_n,t_n;\cdots;x_0,t_0) dx_n\cdots dx_1}{f(x_0,t_0)}
$$

と定義されます.条件付き確率は上式で記号

$$
P(x_n,t_n; \cdots; x_1, t_1 \mid x_0,t_0)
$$

のように表されており,初期の条件を括弧の中に縦棒で区切って右側に明示的に書いておく記法を使います.とくに二つの時点の間のみの条件付き確率

$$
P(x,t \mid x_0,t_0)
$$

のことを遷移確率とかプロパゲータなどと呼び,特に重要な役割をします.

プロパゲータとはある初期時刻に正確なある場所に確率の局在していた系が,のちの時刻にどのように確率が分布しているかを表すものであると言えます.初期状態が広がりを持って分布していた場合は,初期分布にプロパゲータをかけて全状態について積分すればよい.電磁気学などで習うポアソン方程式を解くときに出てくるグリーン関数を知っている人は,プロパゲータとグリーン関数が同じものだということに気づかれたかと思います.


今回は確率過程とそれに伴う種々の確率用語について定義を与えました.特に物理的な測定の観点から話してみたつもりです.より物理的な話はいずれ統計物理のマガジンのひとつとして書く予定です.また,数学のノートとして,確率論は,次回「マルコフ過程」に続く予定ですのでお楽しみに.

______________________________

2021. 02. 05 執筆 & プロパゲータの言葉の定義に少し間違いがあったことに気づき修正
2021. 07. 02  可測関数の説明の誤りを修正

クオリティの高いノートをたくさん書けるように頑張ります!