pix2pixのメモ

2022年10月6日 09:20

GANの応用の中でも代表的なpix2pixについてのメモ
下記の記事で勉強していく。

Image to Image Translation
Conditional GANがベース
U-Netを採用し、入力画像の特徴を維持する
通常のGANのようにノイズを注入するのではなく、dropoutでバリエーションを作り出す。過学習抑制の目的もある？
DによるReal/Fakeの識別に加え、生成画像と正解画像がどれだけ似ているかを表す損失も必要
- 画像全体に対し、各ピクセルのL1距離の平均を加える
- 画像の局所パッチに対するL1距離の平均も加える（PatchGAN）
  - 実装としては畳み込みとストライドでNxNを1x1にしてLossをとる

この記事が気に入ったらサポートをしてみませんか？