マガジンのカバー画像

CV

113
運営しているクリエイター

#セグメンテーション

動画も高精度に!ComfyUIとSegment Anything Model 2(SAM 2)でセグメンテーションをマスターしよう

動画も高精度に!ComfyUIとSegment Anything Model 2(SAM 2)でセグメンテーションをマスターしよう

コンピュータビジョンの世界に革命をもたらした画像セグメンテーションモデル「Segment Anything Model(SAM)」。その登場から約1年、METAが新たな進化を遂げた「Segment Anything Model 2(SAM 2)」を発表しました。画像だけでなく動画にも対応したこの最新モデル、使い方によってはかなり実用的になり得るでしょう。
本記事では、SAM 2の特徴や機能、そして

もっとみる
Google Colab で SAM 2 を試す

Google Colab で SAM 2 を試す

「Google Colab」で「SAM 2」を試したのでまとめました。

1. SAM 2「SAM 2」(Segment Anything Model 2) は、画像や動画のセグメンテーションを行うためのAIモデルです。目的のオブジェクトを示す情報 (XY座標など) が与えられた場合に、オブジェクトマスクを予測します。

具体的に何ができるかは、以下のデモページが参考になります。

2. セットア

もっとみる
Metaのセグメンテーションモデル「SAM2」の論文を読む

Metaのセグメンテーションモデル「SAM2」の論文を読む

この記事の概要Meta AIから発表されたSAM2の論文を解説しています。

SAM2とは動画に対するセグメンテーションモデルです。あるフレームでセグメントしたい物体を選択するとその物体を時間方向にセグメントしてくれます。

SAM2は自身も含むモデルでアノテーションを補助し、さらにモデルを改善していく仕組みで、動画セグメンテーション用の大規模なデーセットを構築しています。

結果、画像と動画の両

もっとみる
【論文瞬読】SAM 2:画像と動画を自在に切り取る魔法のAI

【論文瞬読】SAM 2:画像と動画を自在に切り取る魔法のAI

こんにちは!株式会社AI Nestです。今日は、画像・動画処理の世界に革命を起こす可能性を秘めた最新のAIモデル「SAM 2」について、わかりやすく解説していきます。準備はいいですか?それでは、AIの魔法の世界へ飛び込んでいきましょう!

1. SAM 2とは? AIによる"万能はさみ"の誕生皆さんは、写真や動画から特定のものだけを切り取りたいと思ったことはありませんか?例えば、家族写真から背景だ

もっとみる
セグメンテーションについて

セグメンテーションについて

セグメンテーション:画像を分割する機械学習のタスクセグメンテーションは、画像をいくつかのオブジェクトに分割する機械学習のタスクです。この分野には主に3つのタイプがあります。

1. セマンティックセグメンテーション

目的: 画像中の全ての画素にクラスラベルを予測する。

特徴: 各画素がどのオブジェクトに属するかを識別します。

2. インスタンスセグメンテーション

目的: 画像中の全ての物体

もっとみる

SAM(Segment Anything Model)を用いた画像分析の解説

初めまして、みずぺーといいます。
このnoteを機に初めて私を知った方のために、箇条書きで自己紹介を記述します。

年齢:28歳

出身:長崎

大学:中堅国立大学

専門:河川、河川計画、河道計画、河川環境

転職回数:1回(建設(2年9か月)→IT系年収100万up(現職3か月))

IT系の資格:R5.4基本情報技術者試験合格💮、R5.5G資格

本日はSAMに関して解説します!この一つ前

もっとみる

Ultralyticsの自動アノテーションを試してみた


概要ultralyticsライブラリのセグメンテーション向け自動アノテーション関数auto_annotateを試してみました。

YOLO形式での出力時に塞がれてしまう🍩の穴を復活させる方法を調査して試してみました。

実施内容Google ColabのCPU環境で試しました。

準備

ライブラリインストールとリポジトリのクローンします。

!pip install ultralytics!

もっとみる
どんな画像でもセグメンテーションできるモデル「SAM」の紹介

どんな画像でもセグメンテーションできるモデル「SAM」の紹介

自然言語界隈では、GPTシリーズをはじめとした大規模言語モデルの登場によって、追加学習なしでいろいろなタスクをこなせるようになっています。このような汎用モデルは「基盤モデル(foundation models)」とよばれています。高性能な基盤モデルの公開によって自然言語モデル活用のハードルが大きく下がりました。

基盤モデルの開発は、自然言語以外でも行われています。本記事では、Metaから発表され

もっとみる
Google Colab で CartoonSegmentation を試す

Google Colab で CartoonSegmentation を試す

「Google Colab」で「CartoonSegmentation」を試したので、まとめました。

1. CartoonSegmentation「CartoonSegmentation」は、漫画・アニメのキャラクターのインスタンスセグメンテーションとそれを中心に構築されたいくつかの視覚テクニックを含む、論文「 Instance-guided Cartoon Editing with a Lar

もっとみる