分類AIの進化史㉔その後のCNN系モデル

2024年5月17日 18:47

前回は、ConvNeXt（Meta、2022年）を紹介しました。このモデルでは、Vision Transformer（ViT）などからのアイデアを取り入れて、ResNetをベースにし、畳み込みニューラルネットワーク（CNN）の性能向上を追求しました。

これまでメジャーな画像分類モデルを解説してきましたが、もちろんカバーしていないモデルや論文は無数にあります。それでも、2022年ごろまでのモデルたちに到達したので、このシリーズもそろそろ完結に近づいています。

そこで、以前に登場したモデルの「その後」に触れることで、ここ数年の進化のいくつかを見ていきましょう。

まず、ざっくりと画像分類モデルを以下のようにカテゴリー分けします。

これらのカテゴリーを、今回から３回に分けて「その後の」モデルと題して連載します。初回の今回は、CNNにフォーカスして、以前に紹介したモデルのバージョン２をピックアップして紹介します。

ここから先は

7,387字 / 8画像

¥1,000 / 月

初月無料

人工知能、機械学習、ディープラーニング関連の用語説明、研究論文の概要、プログラミングの具体例などの読み応えのある新しい記事が月に４−５本ほど追加されます。また、気になるAIニュースや日常の雑観などは随時公開しています。

この記事が気に入ったらサポートをしてみませんか？