GANを実装してみる

2023年9月18日 09:43

GAN (Generative Adversarial Network) とは？

敵対的生成ネットワークとも言います。
GANは、Ian Goodfellow氏らによって2014年に提案された新しい形式の生成モデルです。このモデルは、生成器(Generator)と識別器(Discriminator)という2つのネットワークから構成されています。

生成器 (Generator): ランダムなノイズからデータを「生成」する役割を持ちます。
識別器 (Discriminator): 提供されたデータが本物（実際のデータセットからのもの）か、生成器が生成した偽物かを「識別」する役割を持ちます。

GANの特性

非監視学習: 従来のディープラーニングはラベリング済みの大量のデータによる学習(教師あり学習)が必要ですが、GANは学習データを自ら作り出して学習する、教師なし学習で使用されるアルゴリズムのひとつです。
強力な生成能力: GANは、特に画像生成の分野でその力を発揮しており、非常に高解像度で現実的な画像を生成することが可能です。

基本的なGAN(Vanilla GAN)

+---------------+             +---------------+             +---------------+
|               | Noise       |               | Fake Data   |               |
|   Generator   +------------->   GAN Model   +-------------> Discriminator |
|               |             | (untrainable) |             |               |
+---------------+             +-------^-------+             +-------+-------+
                                |    |                             |
                                |    |                             |
                                |    | Real Data                   |
                                |    |                             |
                                |    +-----------------------------+
                                |
                                |
                           Real or Fake

GANの基本的なモデル。2つのネットワーク、Generator（生成器）とDiscriminator（判別器）を使って、新しいデータを生成する。

Generator: ランダムノイズを受け取り、データ（たとえば画像）を生成します。
Discriminator: 提供されたデータが本物（実際のデータセットからのもの）か偽物（Generatorが生成したもの）かを判断する。
目的: GeneratorはDiscriminatorを騙そうと努力し、Discriminatorは本物と偽物を正確に識別しようとします。

StyleGAN

半導体大手の米NVIDIAの研究チームが2018年に発表した手法です。顔や特定のオブジェクトの高解像度の画像を生成するためにデザインされたGAN。独自のスタイル制御メカニズムを持つ。
StyleGAN2、StyleGAN2-ADA、StyleGAN3と性能が向上した手法が開発されています。

特徴: スタイル制御、アダプティブインスタンスノーマリゼーション、マッピングレイヤーなどの技術を使用。
目的: さまざまな「スタイル」の影響を各レベルの詳細で制御できるようにする。

CycleGAN

画像のスタイル変換が得意な手法。例えば、夏の風景を冬の風景に変換するなど。

特徴: 片方向の変換（A -> B）だけでなく、逆方向の変換（B -> A）も学習します。従って、変換の「サイクル」を保持することができる。
目的: 一方のドメインから他方のドメインへの変換を学習し、元のドメインに戻ることで変換が一貫していることを確認します。

Conditional GAN (cGAN)

条件付きGANとも呼ばれます。
2014年にarXivで公開された論文 Conditional Generative Adversarial Netsで提案された生成手法です。
生成されるデータの種類や特性を制御するための条件（例: ラベルや情報）をGANに提供します。

特徴: GeneratorとDiscriminatorの両方に条件を供給します。
目的: 条件に基づいて特定のタイプのデータを生成する。例えば、数字「3」のラベルを条件として提供すると、Generatorは数字「3」の画像を生成しようとします。

注意点

GANは学習が難しく、多くの場合、ハイパーパラメータの調整や特定のアーキテクチャの使用が必要です。モデルが収束しない場合やモード崩壊（常に同じようなデータを生成する）などの問題が発生することがあります。

この講義では、GANの基本的な概念を紹介し、シンプルな1Dデータを生成するためのGANの実装を通じて、GANの動作原理を理解することを目的としています。