見出し画像

情報幾何学の基礎 -前半をざっと-

情報幾何、最近少し知名度が上がってきている気がします。本もかなり出版されてきましたし、勉強会のお知らせをXで見かけたりもします。情報系として知っていなければならないかというと全くそういうわけではないと思いますし、たぶん優先順位としてはかなり後ろの方に来るべきだと思っていたのですが、幾何と情報のマリアージュだなんて夢がありすぎてついつい手を出してしまいました笑
色々読んだ中で藤原彰夫さんの「情報幾何学の基礎」が動機づけが分かりやすかったのでこちらを中心に勉強を進めています。どうやら接続の概念がめちゃくちゃ重要そうなのでそれが主に書かれている本書の前半部分を、双対アフィン接続まで超ダイジェストでまとめようと思います。なお、多様体は既知とします。間違いがあればご指摘お願いします。


共変微分とアフィン接続

場の量子論をやると共変微分という概念が出てきます。タイミングとしてはディラック方程式を局所変換ではなく大局変換に対して不変であるように拡張する時です。この共変微分が数学的に、あるいは微分幾何学的にそもそも何かについて場の量子論で語られることはほとんどない(私は見たことがない)のですが、一般相対性理論や今回取り上げる情報幾何においては極めて重要な役割を持ちます。
ではその共変微分とは何か、一言で言うならば曲がった空間での微分です。一般にベクトルの微分を考える時、その係数の微分は考えますが、基底の微分は考えません。それは基底が各点各点によって変化しないと考えているからです。それは言い換えると空間が曲がっていないということであり、そのような空間はEuclid空間と呼ばれます。
一方、空間の曲がりが重要な役割を果たす一般相対性理論などではこの空間の曲がりこそ記述すべき対象であり、Euclid空間は使われません。そしてそのように曲がった空間では今まで使ってきた微分は機能しなくなり、基底の変化までを考慮した微分が必要になってしまいます、それが共変微分です。
このように共変微分は曲がった空間での微分を可能にするわけですが、曲がり具合によって微分結果も異なると考えられます。これは共変微分が曲がり具合の情報を含んでいるということであり、その量はクリストッフェル記号という係数で与えられます。逆にこのクリストッフェル記号を各点に与えることで曲がり具合が決まるわけで、それをアフィン接続を与えるといいます。なお、共変微分は∇xYといった形で表され、(イメージとしてはYをx方向に微分する)、アフィン接続を与える際は、アフィン接続∇を与えると表現します。
なぜ接続という単語が付くかというと、共変微分は空間を滑らかにつなぐ作用を持つからです。そもそも微分とは滑らかな曲線でしか行うことができません。今回の枠組みで、共変微分が与えられる前は各点がバラバラな状態ですが、共変微分を、つまりクリストッフェル記号を各点に与えることによって各点がつながり微分可能になるわけです。
これでようやく対象の多様体が微分可能になりました。

曲率、捩率

一度アフィン接続が与えられた多様体は、曲がり具合に関する情報をクリストッフェル記号を通して持つため、微分幾何学でおなじみの曲率や捩率の計算ができるようになります。もちろんですが、この曲率や捩率はクリストッフェル記号の関数になっているわけで、クリストッフェル記号が重要出会うrことが分かるかと思います。なお、曲率、捩率ともに0な多様体は∇-平坦であると呼ばれます。

リーマン接続

クリストッフェル記号を与えることにより、曲率が決まり、捩率が決まり、空間の大体の形が決定されますが、そもそもこのクリストッフェル記号はどう決まるのか、が気になるところです。このクリストッフェル記号(共変微分といった方が正確です)はかなり緩い定義によって決まっており、定義からは一意に定めることはできません。
ところがリーマン計量というものが各点に定義されている場合、クリストッフェル記号を計算することができ、空間の形を決定することができます。このように決まる接続をリーマン接続と呼び、リーマン計量が定義されている多様体をリーマン多様体と呼びます。なお、一般相対性理論はこのリーマン計量を少し変えた擬リーマン計量を各点に持つ多様体をベースに作られており、アインシュタイン方程式はこの擬リーマン計量を決定する方程式となっています。
さて、このリーマン計量的であるという特徴を持っています。計量的であるとはざっというと内積の大きさが場所によって変化しないことであり、尺度がどこでも同じことを意味します。数学的には、リーマン計量g、リーマン接続∇、ベクトル場X,Y,Zを用いて
Xg(Y,Z)=g(∇xY,Z)+g(Y,∇xZ)
と書きますが、この式は双対アフィン接続の導入においてきわめて重要です。

双対アフィン接続

最後に先ほど導入しかけた双対アフィン接続について軽く説明します。双対アフィン接続は接続の一種で次の式を満たす∇*として定義されます。
Xg(Y,Z)=g(∇xY,Z)+g(Y,∇*xZ)
これが極めてリーマン接続と似た定義になっていることは言うまでもありません。この双対アフィン接続自体がリーマン計量と違い計量的ではありませんが、アフィン接続∇と双対アフィン接続∇*を両方駆使することにより計量的にすることが可能です。
情報幾何学ではこのアフィン接続∇と双対アフィン接続∇*によって定まる多様体に対して様々な定理を導いていきます。情報幾何におけるピタゴラスの定義もこれを用いて導くことが可能ですが、ここについては次回以降話していければと思います。

追記 (メモ)

双対アフィン接続が情報幾何学でどう応用されるかについてのメモです。
全事象が有限個である場合を考えます。確率は全事象上の関数として考えることができますが、各根源事象の和は1になるという制約から、Euclid空間上の鎖体として表すことが可能です。これを多様体(?)とみなしてそこに計量や接続を考えていくのが最も単純な応用です。
さて、この多様体上の計量を考えるわけですが、確率を考えいているという制限(低次元の部分多様体の幾何構造は高次元に埋め込まれた時と一致すべきという制約)から、実は定数倍を除いて一意に計量が決まることが知られています(Fisher計量)。またそこから導かれるRiemman接続は別の不変性の要請も満たします(アフィン接続に対する不変性)。さらに(0,3)階テンソルも定数倍を除いて一意に決まることをこのRiemman接続と組み合わせることで別の接続を導くことができるのですが、これをα-接続と呼んでいます。αは定数であり、様々な定数を入れることで量が決定されます。
このα-接続が重要で、上に双対アフィン接続の概念を導入しましたが、αと(-α)の関係にある接続はそれぞれ双対の関係になっていることが知られています。このように、確率を考えるとそこに双対構造が現れるというのが、情報幾何の最も重要な主張の一つです


この記事が気に入ったらサポートをしてみませんか?