マガジンのカバー画像

週刊コンピュータービジョン

5
arxivのコンピュータービジョンを週刊でピックアップし、ご紹介します。
運営しているクリエイター

#画像生成

第3号「セマンティックセグメンテーションの高精度化」

Exploring Simple Open-Vocabulary Semantic Segmentationどんなものか: 「S-Seg」は、画像の各ピクセルに意味的なラベルを割り当てるためのモデルで、任意の開放型語彙テキストセットから学習します。このモデルは、手動でアノテートされたセグメンテーションマスクや大規模な事前トレーニングを必要としません。 先行研究と比べてどこがすごいか: 既存の手法では、画像レベルのモデルや手動でアノテートされたマスクに依存することが多いです

第2号「画像編集と動画生成」

Edit One for All: Interactive Batch Image Editingどんなもの 課題:今までの画像編集は一つの画像に対しての手法でした。例えばDragGANも一つの画像に対してです。このような手法を多くの画像に適用するにはどうすれば効率的かということについての課題をこの論文では議論しています。 先行研究と比べてどこがすごい? 新規性: 従来の研究が単一画像の編集に焦点を当てていたのに対し、この研究ではユーザーが指定した編集を一連のテスト画