第3号「セマンティックセグメンテーションの高精度化」
Exploring Simple Open-Vocabulary Semantic Segmentationどんなものか: 「S-Seg」は、画像の各ピクセルに意味的なラベルを割り当てるためのモデルで、任意の開放型語彙テキストセットから学習します。このモデルは、手動でアノテートされたセグメンテーションマスクや大規模な事前トレーニングを必要としません。
先行研究と比べてどこがすごいか: 既存の手法では、画像レベルのモデルや手動でアノテートされたマスクに依存することが多いです