マガジンのカバー画像

CV

113
運営しているクリエイター

#生成AI

Google Colab で SAM 2 を試す

Google Colab で SAM 2 を試す

「Google Colab」で「SAM 2」を試したのでまとめました。

1. SAM 2「SAM 2」(Segment Anything Model 2) は、画像や動画のセグメンテーションを行うためのAIモデルです。目的のオブジェクトを示す情報 (XY座標など) が与えられた場合に、オブジェクトマスクを予測します。

具体的に何ができるかは、以下のデモページが参考になります。

2. セットア

もっとみる
Google Colab で Florence 2 を試す

Google Colab で Florence 2 を試す

「Google Colab」で「Florence 2」を試したので、まとめました。

1. Florence 2「Florence 2」は、Microsoftが開発した軽量なVLM (Vision Language Model) です。キャプション、物体検出、OCRなど、さまざまなビジョンタスクを単一モデルで処理することができます。

2. Colabでの実行Colabでのセットアップ手順は、次の

もっとみる

論文解説 Style-NeRF2NeRF: 3D Style Transfer From Style-Aligned Multi-View Images

ひとことまとめ

概要画像生成AIの変換能力をNeRFに応用することで効率的な3Dスタイル変換を実現した。一度NeRFを学習させたあとSDXLでスタイル変換を行い、そのスタイル画像から再度NeRFを再学習させることで、品質の良いスタイル変換を可能にした

提案手法提案手法は、NeRFから複数の角度でレンダリングを行い、それをスタイル画像に変換する工程と、NeRFを生成したスタイル画像でfinetu

もっとみる
2D-to-3Dの「TripoSR」が話題になったので試してARで召喚してみたよ🐱

2D-to-3Dの「TripoSR」が話題になったので試してARで召喚してみたよ🐱

Tripo × Stability AI が公開した3D生成AIモデル「TripoSR」。
これが精度よく単一画像からの3Dオブジェクト生成をしてくれると話題になってたので早速試してみようと思います。

詳しくはweelさんの記事がとても分かりやすかったので貼っておきます!

インストール後の画面はこんな感じでした。

それではまずStable Diffusion Web UIで黒猫ちゃんを呼んで

もっとみる
Transformers.jsとDepth Anythingで2D画像を3Dへ 他 / Catch up on AI 2024.3.7

Transformers.jsとDepth Anythingで2D画像を3Dへ 他 / Catch up on AI 2024.3.7

Pick up機械学習モデルをJavaScript環境で動作させることができるTransformers.jsとDepth Anythingを利用して制作された、2D画像を3Dへ変換するフレームワーク。

これがブラウザでできるのは色々と可能性を感じます。

https://x.com/taziku_co/status/1765545934317146165?s=20

オンラインデモ
Painti

もっとみる
第4号「コンピュータビジョンの深層学習ベース化」

第4号「コンピュータビジョンの深層学習ベース化」


Control Color: Multimodal Diffusion-based Interactive Image Colorization

画像に色のヒントを与えて着色するための拡散モデルです。

どんなもの?: 高度に制御可能な対話式画像着色手法であり、無条件および条件付き画像着色を支援し、色溢れや不正確な着色を解決します。

先行研究と比べてどこがすごい?: 複数の条件(テキストプロ

もっとみる
第2号「画像編集と動画生成」

第2号「画像編集と動画生成」


Edit One for All: Interactive Batch Image Editingどんなもの

課題:今までの画像編集は一つの画像に対しての手法でした。例えばDragGANも一つの画像に対してです。このような手法を多くの画像に適用するにはどうすれば効率的かということについての課題をこの論文では議論しています。

先行研究と比べてどこがすごい?

新規性: 従来の研究が単一画像の編

もっとみる
第1号 「画像生成と3D物体生成」

第1号 「画像生成と3D物体生成」

はじめのご挨拶

コンピュータービジョンを中心に毎週、新しい研究をいくつかピックアップし紹介いたいます。arXivを中心に紹介する予定ですが、学会が開催されていればそちらから紹介することもあるかと思います。詳細についてはピックアップする記事は少なくとも5~8本は選びたいので、その量から全て把握するのは難しいため、概要を把握するのに論文一つにかける時間を多くは避けません。私はまだまだ精進する身にある

もっとみる