見出し画像

AWS MLS (機械学習) 勉強記⑦ 画像系のタスクとアルゴリズム

今回は画像系のタスクとアルゴリズムに関してです。
画像系は実務でも経験しているので得意分野ではあります。
(勉強記なのか機械学習の事柄をまとめているだけなのか分からないですね笑。まぁ良いでしょう!)
前回の記事はこちらです

はじめに
画像系のタスクのことを一般的にコンピュータビジョン(computer vision)と呼びます。CVなどと略されることもあります。結構頻繁に出てくるので覚えておきましょう!
それでは、画像系の有名なタスクに関して見ていきます!

画像系のタスク(基礎編)

画像分類

画像を見て、それが何の画像かを分類するタスクです。画像の中に複数の物体がある場合はうまく動作することが出来ません。なので使えるケースを見極めて、一つの画像中に一つの物体がある場合に使えば有効です。

画像分類AIの例

物体検出

画像中の物体が、それぞれどのような物体で、どこにあるのかを推定するタスクです。物体の位置を含めて推定するタスクであるため、一つの画像中に複数の画像があっても使用できます。その分、画像分類よりも高度なタスクです。
代表的なアルゴリズムとして「Faster RCNN」が挙げられます。

下の画像では、”人物”、”バッグ”、”自転車”などが検出されていることが分かります。
画像をよく見ると、”1 1.00”や"27 0.60"と書いてあることが分かります。
これは、それぞれ"クラスの番号 確信度"を示しています。確信度はAIがその物体が正しいと思う自信度合いです。
"27 0.60"ですと、27番目のクラス=バッグを検出していて、60%くらいの自信を持っているということです。

物体検出の例

Semantic segmentation(セマンティックセグメンテーション)

セマンティックセグメンテーションは画像内の各ピクセルに対してラベルを付与するタスクです。物体検出の場合は物体を囲うだけでしたが、ピクセル単位の検出をするため、より細かく物体を識別することが可能です。
アルゴリズムとしては「U-Net」が代表的であり、セマンティックセグメンテーションは物体検出よりも高難易度なタスクになるため、処理に時間がかかります。

下の画像はセマンティックセグメンテーションでの検出結果です。マスク画像と呼ばれる画像が出力されます。黄色く塗りつぶされている部分が”人”の部分、紫色に塗りつぶされている部分が”自転車”の部分であることが分かります。例えば、自転車の部分のみを切り出したい、といったケースで有効です。

セマンティックセグメンテーション

画像系のタスク(応用編)

正直、試験には出てこないと思いますが応用編として2つほどタスクを上げます。(応用編はデモがうまくいかなかったので、画像は各ページから引用します)

Instance segmentation(インスタンスセグメンテーション)

インスタンスセグメンテーションは物体検出とセマンティックセグメンテーションを組み合わせたようなもので、画像内の各物体に対してピクセル単位でラベルを振り当てます。例えば一つの画像に「猫」が2匹いる場合にセマンティックセグメンテーションではどちらも同じ「猫」として塗りつぶされてしまいますが、インスタンスセグメンテーションでは「猫A」と「猫B」は区別してマスクを表示させることが出来ます。
代表的なアルゴリズムとして「Mask RCNN」が挙げられます。

下の画像では”人(person)"が5人映っていますが、それぞれのマスクの色が違うことが分かります。これすなわち各々の”人”を区別しているということになります。

インスタンスセグメンテーションの例(図はMaskR-CNNのgitHUBより引用)

Panoptic segmentation(パノプティックセグメンテーション)

パノプティックセグメンテーションは比較的新しい手法であり、セマンティックセグメンテーションとインスタンスセグメンテーションを組み合わせたようなものです。画像内のすべてのピクセルにラベルを割り当てながら、それぞれの物体も区別することが出来ます

下の画像はそれぞれのセグメンテーションの違いを示した画像です。
・セマンティックセグメンテーション
→道路や車すべてのピクセルのマスク画像が出力されているが、車はすべて同じマスクで出力されている
・インスタンスセグメンテーション
→車や人など、物体のマスク画像のみ出力されている
・パノプティックセグメンテーション
→物体と背景のすべてのピクセルのマスク画像が出力されつつ、ここの物体も分けて出力されている

パノプティックセグメンテーションの例(図はPanoptic Segmentationの論文より引用)

ということで、この記事では画像系のタスクに関しての解説でした!
また次回の記事も見てみてください!

前回は画像生成アプリのにじジャーニーの解説記事も書きました!
誰でもAIで画像を作れるので、良かったら参考にしてみてください!

次回の記事はこちら!

この記事が気に入ったらサポートをしてみませんか?