⑨(ここをくりっく)

こんにちは。

画像1

こんかいは、

GAN(ギャン)

です。


機械学習の技術の1つに、

GANがあります。

「generative adverserial network」
の略です。


画像など「本物っぽい」を作る
生成用ニューラルネットワークと

「それを判定する」

(本物・偽物の)
判別用ニューラルネットワークを
競い合わせるように訓練していきます。


ニューラルネットワーク
→脳内の神経細胞(ニューロン)の
ネットワーク構成を類似した数学モデル。


2つのニューラルネットワークを

互いに競わせて入力データの学習を
深めていくことから、

敵対的生成ネットワークとも呼ばれてます。


具体的には?

Generator(生成ネットワーク)



Discriminator(識別ネットワーク)

2つのネットワークから構成されており、

互いに競い合わせることで精度を
高めていきます。

画像2


ざっくり言うと、

生成AI(Generator)と
認識AI(Discriminator)を

競わせて学習を進める方法。


画像の生成なら、

生成AIは、「本物っぽい」画像を
作り出します。

そして、

その画像を認識AIが本物かどうか
判定します。

認識AIがニセモノと判定すれば、
生成AIはそれを学習して、

もっと本物っぽい画像を
作るようにします。


これを繰り返していくと、

「本物と同じ」くらいの

レプリカができあがります。


1番の特徴は、

「教師なし」で学習が可能なことです。


今まではどうだったの?

従来のディープラーニング(深層学習)では、
データのラベリングが必須でした。

たとえば、

犬 飛ぶ4

イヌさんの画像をコンピュータに与え、
「これがイヌ」と答えを
同時に与えます。

コンピュータはイヌさんの特徴を記憶します。


「大量のイヌさんの写真」を与えて、
「イヌらしき特徴」をコンピュータはとらえ、

「おそらくイヌ」と
判断できるようになってきます。

つまり,

「大量のイヌさんの写真」
(教師データ)が必要でした。


GANでは、その必要がなくなります。


「答え」を与えられていない状態で
分類整理し、

「イヌさん」の概念を見つけ出す作業が
できます。

犬 飛ぶ


何ができるの?


1.高品質の画像を作る

データサンプルを与えて低品質の画像から
高い解像度のデータに仕上げていきます。

たとえば、
ピンボケした写真や昔の写真の解像度を
上げるなどといった活用法があります。


2.スタイルを変換する

2つの異なる画像を交換することできます。

たとえば、

ウマくんとシマウマさんの画像では、
シマウマさん → ウマくんに変わったり、

ウマくん → シマウマさんになったりします。

画像4

どうやってるの?

『CycleGAN』で、

無関係な2枚の写真を使い、
その特徴を似せ合うように
ネットワークを構築します。

たとえば、

風景写のデータを組み合わせて、
夏っぽいイメージから冬っぽいイメージに変える
など季節を入れ替えることもできます。

画像6

あと、名画と風景画像を合わせて
風景写真を「モネ風」の絵画に
変えられます。

GAN モネ



ちなみに、

2015年、Googleさんが開発した
初期の画像検出システムでは、

2人の人間を、このように認識。

ゴリラと認識

「ゴリラたち?」

読んでくださり、ありがとうございました。