最新(?)のCNN

・AlexNet:実質上二つのCNNの合体である。

画像1

過学習を防ぐ施策:サイズ4096の全結合層の出力にドロップアウトを使用している。

・ZFNet:

画像2

・GoogLeNet:Inceptionモジュール、Global Average Poolingを導入

画像3

・VGGNet:シンプルで強力

画像4

・ResNet:いままで十数層の構造が限界だったが、resnetは1000層構造でも学習できることが新な時代を作った。以下は50層の場合

画像5

・EfficientNet:ResNetの基本構造を最適化することで、同等性能で小さい計算量で済むネットワーク。

画像6

考察

・画像認識においてCNNはほぼ不可欠な存在になった。特にVGGやResnetはいまでも多くのネットワークに組み込まれている。CNN自体は複雑になっていくが、基本モジュールが変わらないことが多い。そして高精度化よりも高効率化をメインに研究されることが多い。なぜならresnetの1000層構造がすでに人を超える精度を達成した。しかし計算量が膨大でなかなか一般的に使用するのは難しい。

この記事が気に入ったらサポートをしてみませんか?