![見出し画像](https://assets.st-note.com/production/uploads/images/91272384/rectangle_large_type_2_ffa379c5c4736104181826d2e4f27891.png?width=800)
画像認識分野
学習目標
ディープラーニングの画像認識への応用事例や代表的なネットワーク構成を理解する。
物体識別タスク
物体検出タスク
セグメンテーションタスク
姿勢推定タスク
マルチタスク学習
キーワード:ILSVRC、AlexNet、Inceptionモジュール、GoogLeNet、VGG、Skip connection、ResNet、Wide ResNet、DenseNet、SENet、R-CNN、FPN、YOLO、矩形領域、SSD、Fast R-CNN、Faster R-CNN、セマンティックセグメンテーション、インスタンスセグメンテーション、パノプティックセグメンテーション、FCN(Fully Convolutional Netwok)、SegNet、U-Net、PSPNet、Dilation convolution、Atrous convolution、DeepLab、Open Pose、Parts Affinity Fields、Mask RCNN
物体識別タスク
画像分類(Image Classification)、物体識別などと呼ばれるタスクは画像に写っているクラスを予測するものです。ILSVRCでは1000個のクラスがあり、どのクラスが写っているのか確率(確信度)で表します。
簡単な例で、猫、犬、ウサギの3つクラスだけの場合を考えると、モデルが予測として確率値をベクトルとして返します。例えば、[0.1,0.7,0.2][0.1,0.7,0.2]などと予測したとすると、猫10%、犬70%、ウサギ20%となります。
この記事が気に入ったらサポートをしてみませんか?