⑨(ここをくりっく)
こんにちは。
こんかいは、
GAN(ギャン)
です。
機械学習の技術の1つに、
GANがあります。
「generative adverserial network」
の略です。
画像など「本物っぽい」を作る
生成用ニューラルネットワークと
「それを判定する」
(本物・偽物の)
判別用ニューラルネットワークを
競い合わせるように訓練していきます。
ニューラルネットワーク
→脳内の神経細胞(ニューロン)の
ネットワーク構成を類似した数学モデル。
2つのニューラルネットワークを
互いに競わせて入力データの学習を
深めていくことから、
敵対的生成ネットワークとも呼ばれてます。
具体的には?
Generator(生成ネットワーク)
と
Discriminator(識別ネットワーク)
の
2つのネットワークから構成されており、
互いに競い合わせることで精度を
高めていきます。
ざっくり言うと、
生成AI(Generator)と
認識AI(Discriminator)を
競わせて学習を進める方法。
画像の生成なら、
生成AIは、「本物っぽい」画像を
作り出します。
そして、
その画像を認識AIが本物かどうか
判定します。
認識AIがニセモノと判定すれば、
生成AIはそれを学習して、
もっと本物っぽい画像を
作るようにします。
これを繰り返していくと、
「本物と同じ」くらいの
レプリカができあがります。
1番の特徴は、
「教師なし」で学習が可能なことです。
今まではどうだったの?
従来のディープラーニング(深層学習)では、
データのラベリングが必須でした。
たとえば、
①
イヌさんの画像をコンピュータに与え、
「これがイヌ」と答えを
同時に与えます。
②
コンピュータはイヌさんの特徴を記憶します。
③
「大量のイヌさんの写真」を与えて、
「イヌらしき特徴」をコンピュータはとらえ、
「おそらくイヌ」と
判断できるようになってきます。
つまり,
「大量のイヌさんの写真」
(教師データ)が必要でした。
GANでは、その必要がなくなります。
「答え」を与えられていない状態で
分類整理し、
「イヌさん」の概念を見つけ出す作業が
できます。
何ができるの?
1.高品質の画像を作る
データサンプルを与えて低品質の画像から
高い解像度のデータに仕上げていきます。
たとえば、
ピンボケした写真や昔の写真の解像度を
上げるなどといった活用法があります。
2.スタイルを変換する
2つの異なる画像を交換することできます。
たとえば、
ウマくんとシマウマさんの画像では、
シマウマさん → ウマくんに変わったり、
ウマくん → シマウマさんになったりします。
どうやってるの?
『CycleGAN』で、
無関係な2枚の写真を使い、
その特徴を似せ合うように
ネットワークを構築します。
たとえば、
風景写のデータを組み合わせて、
夏っぽいイメージから冬っぽいイメージに変える
など季節を入れ替えることもできます。
あと、名画と風景画像を合わせて
風景写真を「モネ風」の絵画に
変えられます。
ちなみに、
2015年、Googleさんが開発した
初期の画像検出システムでは、
2人の人間を、このように認識。
「ゴリラたち?」
読んでくださり、ありがとうございました。