マガジンのカバー画像

週刊コンピュータービジョン

5
arxivのコンピュータービジョンを週刊でピックアップし、ご紹介します。
運営しているクリエイター

#拡散モデル

第4号「コンピュータビジョンの深層学習ベース化」

Control Color: Multimodal Diffusion-based Interactive Image Colorization 画像に色のヒントを与えて着色するための拡散モデルです。 どんなもの?: 高度に制御可能な対話式画像着色手法であり、無条件および条件付き画像着色を支援し、色溢れや不正確な着色を解決します。 先行研究と比べてどこがすごい?: 複数の条件(テキストプロンプト、ストローク、サンプル画像)を統一フレームワークで扱い、色溢れと不正確な着