見出し画像

書記の読書記録#1170『拡散モデル データ生成技術の数理』

岡野原 大輔『拡散モデル データ生成技術の数理』のレビュー


レビュー

生成モデルに用いられる拡散モデルの数理がまとまった教科書で,現状では本書が第一選択であろう。


もくじ

はじめに:爆発的に応用が広がる拡散モデル
 記号一覧

1 生成モデル
 1. 1 生成モデルとは何か
 1. 2 エネルギーベースモデル・分配関数
 1. 3 学習手法
 1. 4 高次元で多峰性のあるデータ生成の難しさ
 1. 5 スコア:対数尤度の入力についての勾配
  1. 5. 1 ランジュバン・モンテカルロ法
  1. 5. 2 スコアマッチング
  1. 5. 3 暗黙的スコアマッチング
  1. 5. 4 暗黙的スコアマッチングがスコアを推定できることの証明
  1. 5. 5 デノイジングスコアマッチング
  1. 5. 6 デノイジングスコアマッチングがスコアを推定できることの証明
  1. 5. 7 ノイズが正規分布に従う場合の証明
  1. 5. 8 スコアマッチング手法のまとめ
 第1章のまとめ

2 拡散モデル
 2. 1 スコアベースモデルとデノイジング拡散確率モデル
 2. 2 スコアベースモデル
  2. 2. 1 推定したスコアを使ったランジュバン・モンテカルロ法の問題点
  2. 2. 2 スコアベースモデルは複数の攪乱後分布のスコアを組み合わせる
 2. 3 デノイジング拡散確率モデル
  2. 3. 1 拡散過程と逆拡散過程からなる潜在変数モデル
   任意時刻の拡散条件付確率の証明
   DDPMは生成過程の一部分を抜き出して学習できる
  2. 3. 2 DDPMの学習
   式(2. 4)q(x_t−1|x_t, x_0)の証明
  2. 3. 3 DDPMからデノイジングスコアマッチングへ
  2. 3. 4 DDPMを使ったデータ生成
 2. 4 SBMとDDPMのシグナルノイズ比を使った統一的な枠組み
  2. 4. 1 SBMとDDPMの関係
   式(2. 9)q(x_t|x_s)の平均と分散の証明
   目的関数はシグナルノイズ比によって表される
  2. 4. 2 連続時間モデル
  2. 4. 3 ノイズスケジュールによらず同じ解が得られる
  2. 4. 4 学習可能なノイズスケジュール
 第2章のまとめ

3 連続時間化拡散モデル
 3. 1 確率微分方程式
 3. 2 SBMとDDPMのSDE表現
 3. 3 SDE表現の逆拡散過程
 3. 4 SDE表現の拡散モデルの学習
 3. 5 SDE表現の拡散モデルのサンプリング
 3. 6 確率フローODE
  3. 6. 1 確率フローODEとSDEの周辺尤度が一致する証明
  3. 6. 2 確率フローODE の尤度計算
  3. 6. 3 シグナルとノイズで表される確率フローODE
 3. 7 拡散モデルの特徴
  3. 7. 1 従来の潜在変数モデルとの関係
  3. 7. 2 拡散モデルは学習が安定している
  3. 7. 3 複雑な生成問題を簡単な部分生成問題に分解する
  3. 7. 4 様々な条件付けを組み合わせることができる
  3. 7. 5 生成における対称性を自然に組み込むことができる
  3. 7. 6 サンプリング時のステップ数が多く生成が遅い
  3. 7. 7 拡散モデルでなぜ汎化できるかの仕組みの理解が未解決
 第3章のまとめ

4 拡散モデルの発展
 4. 1 条件付き生成におけるスコア
 4. 2 分類器ガイダンス
 4. 3 分類器無しガイダンス
 4. 4 部分空間拡散モデル
  4. 4. 1 部分空間拡散モデルの学習
  4. 4. 2 部分空間拡散モデルのサンプリング
 4. 5 対称性を考慮した拡散モデル
  4. 5. 1 幾何と対称性
  4. 5. 2 化合物配座
   拡散モデルを使った対称性を備えた生成
   確率密度がSE(3)不変となることの証明
   SE(3)同変を達成するネットワーク
 第4章のまとめ

5 アプリケーション
 5. 1 画像生成・超解像・補完・画像変換
 5. 2 動画・パノラマ生成
 5. 3 意味の抽出と変換
 5. 4 音声の合成と強調
 5. 5 化合物の生成と配座
 5. 6 敵対的摂動に対する頑健性向上
 5. 7 データ圧縮
 第5章のまとめ

 付 録
  A. 1 事前分布が正規分布、尤度が線形の正規分布の場合の事後確率分布
  A. 2 ELBO
  A. 3 シグナルとノイズを使った確率フローODEの導出
  A. 4 条件付き生成問題
  A. 5 デノイジング暗黙的拡散モデル
  A. 6 逆拡散過程の確率微分方程式の証明
  A. 7 非ガウシアンノイズによる拡散モデル
  A. 8 Analog Bits:離散変数の拡散モデル

 文 献
 索 引


本記事のもくじはこちら:


学習に必要な本を買います。一覧→ https://www.amazon.co.jp/hz/wishlist/ls/1XI8RCAQIKR94?ref_=wl_share