☆お役立ち情報集☆ 量子力学~情報幾何学・熱力学/統計力学・機械学習までの関係について
【量子力学】
・ヒルベルト空間
量子力学に登場する【ヒルベルト空間】。
古典物理学での物理量を扱う、一般的な空間とは異なり、
確率測度を扱うための空間なので、
確率変数が(値・空間中の座標ではなく)基底ベクトル
として押しやられてしまうことで、
たった1つの物理量を扱うだけでも
(非有界なら)無限次元ヒルベルト空間になってしまうことなどから、
中々理解されにくい空間ですが、
この記事を読めば、確率統計側から理解できて、
非常に理解しやすいと思います。
併せて
【確率密度行列の見方】
【"量子状態" という単語は、具体的には何を指しているのか】
【古典⇔量子 の間の対応関係について】
【量子計量と忠実度・純粋度】
【シンプレクティック多様体】
【量子重ね合わせ/コヒーレンス】
などについても分かりやすいので、
これらについての理解を深める上でもお役立ちです(ง'̀-'́)ง
・量子確率論
【量子確率を「線形代数+確率」の別名として解説する記事です】
確率密度行列・密度演算子について、
【同時確率分布】と【周辺確率分布】(条件付き確率分布)
の観点から解説した、非常に分かりやすい記事です。
☆周辺確率分布の観点からすれば、
量子力学での物理量の非可換性
についても自明ですよね
(条件付き確率なので演算順序に依存する)
なぜ量子力学では、複素数で確率が表現されるのかについても
対角成分(実数)と非対角成分(虚数)
という解釈の仕方が可能になります。
※確率量が複素数・虚数なのか、
基底ベクトルが複素数・虚数なのかについては、諸説あります。
※※対角成分を実部(選択している基底での波動関数の表示方法)
での確率密度関数として扱い、
非対角成分をホッジ双対での擬ベクトルやパウリ行列として
虚部(選択していない基底での波動関数の表示方法)
での確率密度関数として扱う、
という解釈もできると思います。
複素構造については、特殊相対論でのローレンツ変換と
ミンコフスキー計量における、時空速度の光速定数による制限
を考えるとイメージしやすいと思います。
物理空間速度が速くなるほど、固有時間速度(時間の流れ)が遅くなる
各速度の二乗の和は、光速定数の二乗で常に固定されている
(複素構造・ピタゴラスの定理・時空の線素)
純粋状態・混合状態・フォンノイマンエントロピー
量子もつれ・エンタングルメント・エントロピー
テンソル積と相互作用
(確率分布/密度関数を、ベクトル/値・スカラーのリストとして扱って、全ての同時確率/条件付き確率の組み合わせを計算するための、特殊な積。値である確率量だけではなく、確率変数である基底ベクトルの情報も引き継がれる。)
などについても分かりやすいです。
これらの理解を得ることによって
【プロセス⇔量子状態の双対性】
を理解することができます。
これは、リーマン幾何において、
・空間がユークリッド(曲がっていない)で、関数が曲がっている
・空間が非ユークリッド(曲がっている)で、
関数が曲がっていない(測地線)
の間に双対性があることと関連しています。
ここまで理解できれば
【テンソルネットワーク】
というものが、様々な物理現象(ミクロ~超マクロまで)を
表現できるポテンシャルを持っていることが理解できます。
そうすれば、これを情報幾何学の観点から解釈しようと試みることは
単なる時間の問題です。
そうなれば、【情報=物理】【It from Qubit】という考え方・世界観についても、自明ということになります。
・量子計量の補足 (情報計量や、ケーラー多様体・カラビヤウ多様体・超弦理論・位相幾何・トポロジカル物性についても)
量子計量である、Fubini-Study計量(純粋状態)と
Bures-Wasserstein計量(混合状態)についての解説。
Bures計量は量子計量であるものの、
情報計量であるWasserstein計量と同じものなので、
【量子力学⇔情報幾何学(最適輸送理論)】の間の双対性、
【物理 ⇔ 情報】の双対性
としても、非常に重要な計量です。
そしてこれらの計量が
【忠実度】【量子相対エントロピー / 量子相互情報量】
と同じであることも、
空間曲率と、その曲率によって生じる【力】とはそもそも何なのか
について理解する上で、非常に重要です。
量子力学での定式化(指数型分布族、複素確率、非可換性、クラメールラオの情報不等式の下限)によって、必然的に
【シンプレティック構造】
【複素構造】
【リーマン計量(量子計量・情報計量)】
が発生するので、必ずケーラー多様体になり、
指数型分布族の性質(オイラーの公式による三角関数への分解)によって
コンパクト化されカラビヤウ多様体になるため、
カラビヤウ多様体を扱う理論である【超弦理論】とも対応します。
記事中の末尾の図が、
【量子速度限界】【不確定性原理】と
【忠実度】【計量テンソル / 空間曲率】
を関連付けて理解するために、非常に分かりやすくて、非常に重要です。
また、これらの量子計量は、ベリー位相としても表現されることがあり
この計量テンソルによる空間曲率が、位相幾何情報・トポロジカル物性を生じていることが理解できます。
【情報幾何学】
・情報幾何学の初歩(超オススメ!)カリフォルニア大学リバーサイド校数学教授による記事 ※ラグランジュの未定乗数法(分配関数・状態和)とギブス測度、エントロピーと温度・熱についても
確率分布と統計多様体、情報計量、量子力学をつなげて理解するための
【カリフォルニア大学】リバーサイド校 John Baez数学教授
による、非常に重要で分かりやすい記事です。
これを読めば、量子力学について、情報幾何学の観点から解釈することの重要性が、よく理解できるようになります。
また、量子統計力学とギブス状態・ギブス測度※の絡みから
エントロピーが温度・熱と関連していることについても理解できます。
また、ラグランジュの未定乗数法(分配関数・状態和)が、ギブス測度に直結していることも理解できます。
※何らかの状態が、個数で表現できるときに、個数を全て数え上げたもの:状態和/分配関数で、それぞれの個数を割れば、比率/割合/確率が得られるので、これを確率量/確率測度として確率統計的に扱い、かつ、この確率からエントロピーを計算して物理学・熱力学的に扱うとき、通常の確率統計での確率量という呼び方に対して、特別に【ギブス測度】と呼ぶ。
このときの「個数の数え上げ/状態和/分配関数」を計算する方法の1つが、ラグランジュの未定乗数法なので、この未定乗数法を使って得た確率量は、ギブス測度として扱える。
☆「(状態の)個数 → 確率量」へ変換したとき、
この確率量のことを、特別に【ギブス測度】と呼ぶ。
この方法による【確率の計算の仕方】は
「確率の解釈」「確率の哲学」の分野における、
【頻度主義】【傾向主義】
をそのまま実装した形になっています。
【エネルギーの共役変数は逆温度です!】というところも
エントロピー(偏差※)/温度/熱と、エネルギー(期待値・古典物理量)
という
【量子力学における物理量とはそもそも何なのか】
ということを理解する上で、非常に重要なテーマとなっています。
※【マクロな統計パラメータ】である古典偏差とは全くの別物です。
量子偏差は【たった一つの量子】であるにもかかわらず、
その古典物理量(量子力学的には、物理量の期待値)には
必ず非ゼロの偏差が伴う、という特徴があります。
また、期待値・偏差について、
ギブス状態であれば、それらを微分操作によって定義することができることや、共分散行列・相関行列としての解釈についても非常に重要です。
※共分散行列は、量子計量テンソルや情報計量テンソルでもあるため。
古典力学と量子力学の興味深い違いがここに表れます。
古典力学では共分散行列は常に対称ですが、量子力学ではそうではありません!
量子力学においても、共分散行列の実部は対称であることがわかります。そして、それがフィッシャー情報計量を使うべき理由なのです。
ケーラー多様体とは、対称テンソルgと歪対称(反対称)テンソルωを備えた多様体のこと
物理学の世界には、対称のgと歪対称のωを持つ状態空間が他にも存在するということです。
それらは、エントロピーが増大する系の研究である「散逸力学系」に現れます。
という視点も非常に重要です。
【対称な計量テンソル】【非対称な発散テンソル/ダイバージェンス】
というものは、
・フィッシャー情報量や相互情報量と、カルバックライブラー情報量の違い
・条件付き確率の違い
・演算順序の違い
・順過程の遷移確率と逆過程の遷移確率の違い
・平衡系か非平衡系かの違い
などなど様々な文脈として解釈できます。
【対称のg】と【歪対称のω】を持つ状態空間
エントロピーが増大する系の研究である「散逸力学系」
というところは、情報幾何学/最適輸送理論における
・【維持エントロピー / 対称な計量g / 平衡系としての性質】
・【過剰エントロピー生成 / 歪対称な発散ω / 非平衡系としての性質】
に対応していると思います。
※東京大学の伊藤創祐先生たちの論文が
非常によくわかりやすいと思います。
Two applications of stochastic thermodynamics to hydrodynamics, Kohei Yoshimura and Sosuke Ito @ito_sosuke @UTokyo_Science #StatisticalPhysics https://t.co/9ZK4abOcxx pic.twitter.com/XY2bXmUM27
— Physical Review Research (@PhysRevResearch) June 11, 2024
吉村くんの論文がPRResearchから出版されました。ナビエストークス方程式でのニュートン流体におけるエントロピー生成率の定義と、維持過剰分解、熱力学的不確定性関係の論文です。https://t.co/imp0S1slJk
— Sosuke Ito (伊藤 創祐) (@ito_sosuke) June 10, 2024
大賀さんの情報幾何に関する論文がようやく出版されました。 https://t.co/iHsFizw3qh
— Sosuke Ito (伊藤 創祐) (@ito_sosuke) March 22, 2024
情報幾何における双対性を、Markov jump系やLangevin系の緩和においていかに使うか、という話です。非定常な緩和の話を、双対性から平衡状態の一種として取り扱う話なので、応用可能性は高い話だと思っています。
通常のハミルトン力学では、状態の空間は多様体であり、時間発展とはハミルトニアンと呼ばれる滑らかな関数によって決まる、この多様体上の流れです。
この一般化においても状態空間は多様体ですが、時間発展はエネルギーとエントロピーという2つの滑らかな関数によって決まります!
通常のハミルトン力学では、エネルギーは自動的に保存されます。
この一般化でもそれは同じですが、エネルギーは熱という形態に変化でき...エントロピーは自動的に増大します!
この部分も、情報幾何学・量子力学・量子統計力学・熱力学を繋ぐ、非常に重要な考え方になっています。
ケーラー構造の虚部はシンプレクティック構造、例えばωであり、ポアソン括弧を得るための常として、{F,G} = ω(dF,dG)を定義することができます。
ケーラー構造の実部はリーマン構造、例えばgであり、[F,G] = g(dF,dG)を定義することができます。
これは[F,GH]=[F,G]H+G[F,H]を満し、[F,F] ≧ 0です。
このGENERICという枠組みは、
エネルギーとエントロピーを1つの実体の2つの部分として見るべき
ことを示唆しています!
そしてそれは、散逸系を記述するために複素数値ハミルトニアンを使うというアイデアや、「虚時間としての逆温度」というアイデアのような、他の奇妙なことを思い出させます。
すべての物理量には、
その物理量の具体的な/静的な値を示す【座標】と、
その変化速度/動的な値を示す【波数 / 速度】があり、
それらがシンプレティック構造に由来していて、
かつ、複素構造によって、実質的な自由度が1つしかないこと
と関係しています。
また、【エネルギー】は確率分布の【期待値】に、
【エントロピー】は確率分布の【偏差】に対応していて、
これもまた、上と同じくシンプレティック構造※・複素構造に由来していることになります。
※1階微分によって期待値、2階微分によって偏差が得られる
また、エントロピーは、基底ベクトルである確率変数/物理量を抽象化して、
自己情報量に置き換えたものでもあるので、
3次以上のモーメントが0として扱えるような、左右対称な正規分布であれば、たった一つ、期待値と同じ値を示す確率変数を基底ベクトルとして選ぶことで、自動的に確率分布が復元できます。
ヒルベルト空間が可積分なので、どのような確率密度関数であったとしても、フーリエ変換で混合分布へ変換することができるので、
物理学で扱う範囲に限定すれば、
「エネルギー/期待値」と「エントロピー/偏差」
についても、シンプレティック構造・複素構造として扱える(虚時間としての逆温度など)ということに繋がります。
あなたが、この空間の任意の点を私に与えます。
私は、その点の座標を位置、運動量、エネルギーの平均値と考えて、
この平均値を持つ最大エントロピーの状態を見つけます。
そしてその状態のゆらぎを計算して、楕円体として描きます。
もしあなたが位置と運動量の平均値がゼロになる点を選んでも、問題の回転対称性を破っていません。
なので、私の楕円体は回転対称のはずです。
しかし、あなたが位置と運動量の値としてその他の平均値を選ぶと、意味がなくなります!
幸い、この素朴な推測は実際正しいのです。
すべての楕円体は回転対称であり、ゼロ以外の位置と運動量を中心とする楕円体も回転対称です!
その理由はすぐにわかります。
そして、この一連の投稿をご覧になっている方なら、
このことが何を意味するかお分かりになるでしょう。
位置-運動量-エネルギー空間の「フィッシャー情報計量」
g = 定数c (dq^2 + dp^2)
は、任意の垂直軸に対して回転対称性を持っています。
(繰り返しますが、垂直軸をエネルギーと考えています。)
したがって、この空間を任意の水平面でスライスすると、その平面上の計量(距離)は、平面の通常の計量に定数を掛けたものになります。
なぜでしょうか?
平面上の通常の計量、あるいはその定数倍の計量だけが、
すべての点の回りの通常の回転を対称性として持つからです。
つまり、大雑把に言えば、フィッシャー情報計量から
位置-運動量平面の「自明な」幾何学を復元しているのです!
しかし、ゲームの入力として、調和振動子のハミルトニアン
H = 1/2 (q^2 + p^2)
を使ったのだから、これは驚くべきことではありません。
量子調和振動子や、複素平面波として表現されるような
複素構造(不変量・保存則・束縛条件・拘束条件など)を持つ
二つの任意の物理量の組み合わせ
(特に、【座標】と【その変化速度/波数】)
については、必ずこの種の情報計量テンソルを持ち、
必ずリーマン計量をもつリーマン幾何学の性質を引き継ぎます。
これは【クラメールラオの情報不等式の下限】とも関係※しており、
量子状態の【忠実度】のような擬距離としても用いられます。
※フィッシャー情報量の逆数で与えられ、
それは変数の個数(ここでは2変数なので2個)によって決定されるため
H = 1/2 (q^2 + p^2) の係数「1/2」 = 50% = 「1bitのエントロピー」
として関連してきます。
量子力学の観測可能量が可換ではないので、フィッシャー情報計量には、以下のようなωと呼ばれる奇妙な歪対称(反対称)の対があることに気づきました。なので、この例でも考える必要があります。
そうすると、位置-運動量-エネルギー空間の任意の水平面に制限すると、以下が得られることがわかります。
ω = 定数c (dqdp - dpdq) ※交換関係
これはフィッシャー情報計量gの突然変異バージョンのようです。
そして、幾何学を知っていれば、これが位置-エネルギー平面上の通常の「シンプレクティック構造」(少なくても定数倍の)であることがわかります。
別のこともわかります。
gの定数はエネルギーに依存しますが(つまり、どの水平面をとるかに依存しますが)、ωの定数は依存しません!
水平面上の計量gは、位置と運動量のゆらぎの情報を追跡しているのです。熱ゆらぎは、熱くなればなるほど大きくなります。
つまり、エネルギーを増大させて、水平面を位置-運動量-エネルギー空間のさらに上方に移動させると、水平面上の計量は大きくなります!
言い換えれば、高エネルギーでは楕円体の断面が太くなります。
一方、シンプレクティック構造ωは、
量子力学では位置qと運動量pが可換ではない
という事実から生じます。
これらはハイゼンベルグの「正準交換関係 qp−pq=i 」に従います。:
量子力学での【正準交換関係】が、情報計量・歪対称な発散/ダイバージェンスと関係していることが分かります。
そしてそれが【シンプレクティック構造に由来】していることも分かります。
というわけで、わたしたちは問題を、
ある温度で熱平衡にある調和振動子の問題に還元することに成功しました!
これが【量子熱力学】【確率的熱力学】などへ繋がっていきます。
フィッシャー情報計量が観測可能量のゆらぎをどのように記述するかについての基本的な直感に戻りましょう。
数学的には、これは【共分散行列】の【実部】ということです。
g11は与えられた
温度における調和振動子の【位置】の分散(偏差)
に等しく、
g33はその
【エネルギー】の分散(偏差)
に等しくなります。
温度がゼロに近づくにつれ、熱平衡状態にある調和振動子はエネルギーが最も小さい状態、いわゆる「基底状態」に近づきます。
基底状態では、位置と運動量の標準偏差はハイゼンベルグの不確定性原理、:ΔpΔq >= 1/2
で許される最小値になります。
そして、位置と運動量の標準偏差は等しいので
g11 = Δq^2 = 1/2
となります。
このようにして、
不確定性原理・偏差・(熱力学的)温度・
クラメールラオの情報不等式の下限
が、エントロピー/(統計学的な)推定限界と結びつけられ、
それらが情報計量テンソル ≒ 共分散行列の実部によって計算され、
さらに、正準交換関係 ≒ シンプレクティック構造に由来
していることがわかります。
計量の歪対称な対はどうでしょうか?
任意の水平面に対してωを制限していることがわかります。
まとめ:位置-運動量-エネルギー空間の任意の水平面に制限すると、
調和振動子のフィッシャー情報計量は以下のようになります。
【定数は温度に依存】し、
【温度ゼロの極限では1/2に等しく】※クラメールラオの情報不等式
温度が上昇するにつれて増加します。
同じ平面に制限すると、フィッシャー情報計量の歪対称な対は以下のようになります。
ω=1/2 dq_0 ⋏ dp_0
まず、E_0が一定の平面、あるいは温度が一定の平面に制限した場合、
(計量である)【gやωの物理的な意味】は何でしょうか?
物理的な考え方:
温度一定の平面に制限すると、
gは観測可能量の共分散行列です。
これは温度に依存します。
温度ゼロの極限では熱ゆらぎはなくなり、
gは基底状態の量子ゆらぎにのみ依存します。
一方、温度一定の平面に制限されるωは、
非可換な観測可能量に対するハイゼンベルグの不確定性関係を記述します。これは温度に依存しません。
次に、これはケーラー幾何学とどのような関係があるべきなのでしょうか?【複素平面】には、【ケーラー構造と呼ばれる複素数値の計量】があることを思い出してください。
※ケーラー構造は、【超弦理論】で使われる、
【カラビヤウ多様体】の一般形です
その【実部はリーマン計量】であり、
その【虚部はシンプレクティック構造】です。
複素平面を点粒子の位置-運動量平面と考えることができます。
そして、シンプレクティック構造はハミルトン力学に必要な基本要素であり、リーマン構造は調和振動子のハミルトニアンに必要な基本要素なのです。
なので、量子力学では、
エネルギーをハミルトニアンで定義して、
正準交換関係を課すので、
必ずシンプレクティック構造になり、
複素計量が存在し、
ケーラー多様体・カラビヤウ多様体になるため、
超弦理論と同じ多様体を扱うことになります。
最も重要な事実は、確率分布p(t)が時間変化するとき、
フィッシャー情報計量を用いて測られるその変化速度∥dp/dt∥は、
情報が学習される速度と考えられることです。
時間依存の確率p(t)で与えられる、
時間とともに滑らかに変化する仮説があったとします。
第一近似では、何も学ばないということです。
第二近似では、自分の意見が固定されていない限り、
常に何かを学んでいることになる。
このことから、「学習速度」、
つまり【確率分布p(t)が変化する「速度」】を定義することができます。
そして、これは厳密にフィッシャー情報計量で与えられる速度です!
これまで量子力学と情報幾何学、熱力学・統計力学の関連について学習してきた後で、このような「情報の学習速度」という視点が加わることで
【統計力学的機械学習】
という視点が得られます。
そこから
【自由エネルギー原理】【最適輸送理論】
などを加えることによって、
【システム生物学】
【脳神経ネットワークのトイモデルとしての機械学習】
へと派生していきます。
また機械学習の実装形式は、ある種の【テンソルネットワーク】と解釈できるので【量子情報】の文脈としても解釈可能です。
(確率分布を量子状態・状態ベクトル・密度行列と解釈する)
この記事について関連するメモについても、
ご参考までに共有いたします( *ˊᵕˋ* )
・国立研究開発法人 科学技術振興機構(略称JST)の資料 【情報=物理】
こちらで書いたように【情報=物理】の観点を、
【JSTが推している】というのは、非常に大きな流れで、
その中心が【情報幾何学】なので、今後も情報幾何学ベースで、
関連する様々な学問が発展していくように思っています( *ˊᵕˋ* )
・専門書(改めて紹介する必要は薄いですが・・・)
こちらの本は、情報幾何学について、
統計力学や量子情報などの物理学との絡み
の解説もあるので、とっても助かります( *ˊᵕˋ* )
こちらは【情報熱力学】で有名な東大の沙川教授のご著作。
情報幾何的な側面についても含まれていながら、
非平衡統計力学についての理解が深まる
とても素晴らしい一冊です( ⸝⸝•ᴗ•⸝⸝ )
こちらはタイトルとは関連が薄いですが、
量子計量・情報計量・相互情報量/量子相関/エンタングメントからの
【時空の創発】
というテーマで【情報=物理】と非常に関連するテーマですので
興味がある方は是非、ご一読を! (ง'̀-'́)ง
テンソルネットワークとも関連しています!
この記事が気に入ったらサポートをしてみませんか?