見出し画像

Segment Anything Model2(SAM2),Meta AIを使ってみた

先日紹介しましたSAMは、画像認識のモデルでした。
2024年7月29日に発表がありましたSAM2は、動画と画像の両方を認識できるモデルになります。

SAM2のデモサイトのリンクは↓の通りです。

SAMとの違い
SAMは画像認識だけだったので、SAM2は動画も認識できるようになりました。
以下の画像の通り、動画で流れている途中で分類したい箇所を選択して再送すると、その後も分類された状態になります。例えば、手(青)、ポット(緑)、コップ(黄)とした場合、ポットから出るコップに注ぐコーヒー(④)は分類されずに動画が再生されます。

分類したい箇所を選択(②)→動画を再生すると分類箇所が色付け

SAM2の効果
SAMと同様ですが、動画生成をする場合のアノテーションデータ作成に有用だと考えます。動画生成まではチャレンジしたことがないので、今後試してみたいと思います。

この記事が気に入ったらサポートをしてみませんか?