pix2pixのメモ

GANの応用の中でも代表的なpix2pixについてのメモ
下記の記事で勉強していく。

  • Image to Image Translation

  • Conditional GANがベース

  • U-Netを採用し、入力画像の特徴を維持する

  • 通常のGANのようにノイズを注入するのではなく、dropoutでバリエーションを作り出す。過学習抑制の目的もある?

  • DによるReal/Fakeの識別に加え、生成画像と正解画像がどれだけ似ているかを表す損失も必要

    • 画像全体に対し、各ピクセルのL1距離の平均を加える

    • 画像の局所パッチに対するL1距離の平均も加える(PatchGAN)

      • 実装としては畳み込みとストライドでNxNを1x1にしてLossをとる



この記事が気に入ったらサポートをしてみませんか?