CV - 生成AI｜thomas

2024年8月16日 22:41

Google Colab で SAM 2 を試す

「Google Colab」で「SAM 2」を試したのでまとめました。

1. SAM 2「SAM 2」(Segment Anything Model 2) は、画像や動画のセグメンテーションを行うためのAIモデルです。目的のオブジェクトを示す情報 (XY座標など) が与えられた場合に、オブジェクトマスクを予測します。

具体的に何ができるかは、以下のデモページが参考になります。

2. セットア

もっとみる

npaka

2024年8月16日 11:45

Google Colab で Florence 2 を試す

「Google Colab」で「Florence 2」を試したので、まとめました。

1. Florence 2「Florence 2」は、Microsoftが開発した軽量なVLM (Vision Language Model) です。キャプション、物体検出、OCRなど、さまざまなビジョンタスクを単一モデルで処理することができます。

2. Colabでの実行Colabでのセットアップ手順は、次の

もっとみる

atakana

2024年6月25日 17:40

論文解説 Style-NeRF2NeRF: 3D Style Transfer From Style-Aligned Multi-View Images

ひとことまとめ

概要画像生成AIの変換能力をNeRFに応用することで効率的な3Dスタイル変換を実現した。一度NeRFを学習させたあとSDXLでスタイル変換を行い、そのスタイル画像から再度NeRFを再学習させることで、品質の良いスタイル変換を可能にした

提案手法提案手法は、NeRFから複数の角度でレンダリングを行い、それをスタイル画像に変換する工程と、NeRFを生成したスタイル画像でfinetu

もっとみる

SUTO💡

2024年3月14日 15:53

2D-to-3Dの「TripoSR」が話題になったので試してARで召喚してみたよ🐱

Tripo × Stability AI が公開した3D生成AIモデル「TripoSR」。
これが精度よく単一画像からの3Dオブジェクト生成をしてくれると話題になってたので早速試してみようと思います。

詳しくはweelさんの記事がとても分かりやすかったので貼っておきます！

インストール後の画面はこんな感じでした。

それではまずStable Diffusion Web UIで黒猫ちゃんを呼んで

もっとみる

Yoshihiro Tanaka | taziku

2024年3月8日 08:16

Transformers.jsとDepth Anythingで2D画像を3Dへ他 / Catch up on AI 2024.3.7

Pick up機械学習モデルをJavaScript環境で動作させることができるTransformers.jsとDepth Anythingを利用して制作された、2D画像を3Dへ変換するフレームワーク。

これがブラウザでできるのは色々と可能性を感じます。

https://x.com/taziku_co/status/1765545934317146165?s=20

オンラインデモ
Painti

もっとみる

AIXTECH（AIクロステック）

2024年2月19日 14:51

第4号「コンピュータビジョンの深層学習ベース化」

Control Color: Multimodal Diffusion-based Interactive Image Colorization

画像に色のヒントを与えて着色するための拡散モデルです。

どんなもの？: 高度に制御可能な対話式画像着色手法であり、無条件および条件付き画像着色を支援し、色溢れや不正確な着色を解決します。

先行研究と比べてどこがすごい？: 複数の条件（テキストプロ

もっとみる

AIXTECH（AIクロステック）

2024年1月23日 06:15

第２号「画像編集と動画生成」

Edit One for All: Interactive Batch Image Editingどんなもの

課題：今までの画像編集は一つの画像に対しての手法でした。例えばDragGANも一つの画像に対してです。このような手法を多くの画像に適用するにはどうすれば効率的かということについての課題をこの論文では議論しています。

先行研究と比べてどこがすごい？

新規性: 従来の研究が単一画像の編

もっとみる

AIXTECH（AIクロステック）

2024年1月18日 05:19

第1号「画像生成と3D物体生成」

はじめのご挨拶

コンピュータービジョンを中心に毎週、新しい研究をいくつかピックアップし紹介いたいます。arXivを中心に紹介する予定ですが、学会が開催されていればそちらから紹介することもあるかと思います。詳細についてはピックアップする記事は少なくとも5~8本は選びたいので、その量から全て把握するのは難しいため、概要を把握するのに論文一つにかける時間を多くは避けません。私はまだまだ精進する身にある

もっとみる

CV

フォローしませんか？

#生成AI

Google Colab で SAM 2 を試す

Google Colab で Florence 2 を試す

論文解説 Style-NeRF2NeRF: 3D Style Transfer From Style-Aligned Multi-View Images

2D-to-3Dの「TripoSR」が話題になったので試してARで召喚してみたよ🐱

Transformers.jsとDepth Anythingで2D画像を3Dへ他 / Catch up on AI 2024.3.7

第4号「コンピュータビジョンの深層学習ベース化」

第２号「画像編集と動画生成」

第1号「画像生成と3D物体生成」