敵対的生成ネットワークの考え方

2022年7月11日 22:39

はじめに

機械学習の主なタスクは「分類」と「回帰」であり、この二つを行うものは識別モデルに区別されます。機械学習モデルにはもう一つ、生成モデルというものがあります。今回は、生成モデルである敵対的生成ネットワークについて述べます。

生成モデル

識別モデルと生成モデルの違いは何でしょうか？それは、モデルが決定的であるか確率的であるかということです。識別モデルは決定的なモデルです。入力データに対して出力データは一意に決まります。一方、生成モデルは確率的なモデルです。確率的であるとは、偶然性（ランダム性）を持っているという意味です。入力データには存在しなかったデータを生成することが可能になります。
生成モデルの学習は識別モデルよりも困難なことが多く、まだまだ発展途上です。しかし、人工知能がこの世に存在しない風景画や音楽を生成するということに対して人々の興味は尽きないでしょう。
次節では、生成モデルの一つである敵対的生成ネットワークについて述べます。

敵対的生成ネットワーク（GAN）

敵対的生成ネットワーク[1]は英語で「Generative Adversarial Network」といい、GANと略されます。GANは、生成器（Generator）と識別器（Discriminator）の二つのネットワークから成ります。この二つを競わせて学習を行うことから"敵対的"という名前がついています。

GANの学習はしばしば偽札屋（生成器）と鑑定人（識別器）に例えられます。偽札屋は偽札を作成して、鑑定人を騙そうとします。鑑定人はお札が本物かを判定します。最初は簡単に偽札を見分けることができますが、徐々に偽札屋も学習します。本物に近い偽札を何回も作成していくうちに、やがては鑑定人も見分けがつかないくらいの偽札を作り上げるようになります。

実際のGANでは、乱数（ノイズ$${z}$$）を生成器$${G}$$に与え、生成データ$${G(z)}$$を出力します。この乱数を与えるということが確率的である所以です。次に、$${G(z)}$$を識別器$${D}$$に与えます。$${D}$$は、0~1の確率$${p}$$を出力します。0に近いほど偽物、1に近いほど本物であることを表しています。識別器に$${G(z)}$$と実データ$${x}$$を交互に与えることで学習を行います。$${D}$$の出力が0.5付近になったら、$${D}$$が本物かを見分けられなくなった証拠です。
以上がGANの考え方になります。

おわりに

今回はGANの考え方について簡単に述べました。私はGANについて研究をしています。GANはまだまだ課題も多く黎明期です。だからこそ、研究する意味があると思っています。次回は、GANの数式について説明する予定です。

参考文献

Ian Goodfellow, Jean Pouget-Abadie, Mehdi Mirza, Bing Xu, David Warde-Farley, Sherjil Ozair, Aaron Courville, and Yoshua Bengio. Generative adversarial nets. Advances in neural information processing systems, Vol. 27, , 2014.

この記事が気に入ったらサポートをしてみませんか？