画像の認識・理解シンポジウム MIRU2023に参加してきました

2023年9月26日 11:50

こんにちは！AI Strategy Center（以下AISC）の岩隈です。

2023年7月25日から7月28日にかけてアクトシティ浜松にて開催された画像の認識・理解シンポジウム（MIRU）2023に、同じくAISC Researcherの河本さんと参加してきましたのでその報告をさせて頂きます。

前回報告させて頂いたJSAI2023（宜しければ下のリンクからご覧ください！）とは違って、今回はスポンサー企業として参加した訳ではありません。GA groupにはメンバーの自己研鑽や業務活用を目的に学会やカンファレンスへの参加などを支援するテックチャージという制度があり、今回はその制度を利用して聴講者として参加させて頂きました。

MIRUについて

そもそもMIRUとは？というところで、MIRU2023のホームページから概要を引用させて頂きます。

画像の認識・理解シンポジウム（MIRU）は、画像の認識と理解技術に関する国内最大規模の会議です．大学/産業を問わず，研究者，技術者，そして次世代を担う学生の議論・交流の場であり，基礎から応用まで最新の研究発表と討論の場です．

概要 | MIRU2023
http://cvim.ipsj.or.jp/MIR U2023/overview/

GA technologiesとしては2021年以来の2年ぶりの参加となりました。また2021年開催時はコロナの影響もありオンライン開催でしたが、今年はオンラインとオフラインの同時開催で行われました。

どういったことが行われるかイメージが付きづらいかなとも思うので、タイムテーブルについても紹介します。1日目はチュートリアルのみで、2日目以降は前半に口頭発表・後半にポスター発表があり、その間に特別講演などの各種イベントがある形になっています。ちなみにMIRU2023の参加者は1513名でした（最終日最後のクロージングで発表がありました）。

MIRU2023のタイムテーブル
http://cvim.ipsj.or.jp/MIRU2023/program/

業務の都合で僕は25日・26日はオンラインで、27日・28日はオフラインで参加させて頂きました。27日の夜には交流会が行われ河本さんと参加したのでその時の写真を載せておきます。

気になった発表の紹介

続いて、MIRU2023に参加して僕が気になった発表について簡単に紹介したいと思います。前提として僕は業務で間取り図を対象とした領域分割や画像編集を扱っているため、それに関連する発表中心になっています。ここでは紹介しきれませんが他にもすごく面白い研究がいっぱいありました。また、特別講演や招待講演も示唆や学びに富む素晴らしい内容でした。

#OS1A-L2 アテンションはアノテーションの代わりになるか？：テキスト−画像生成モデルの注意機構を利用した領域分割の弱教師あり学習

吉橋亮太, 大塚雄也, 土井賢治, 田中智大 (ヤフー)

この研究では、Text2Imageモデルの出力画像と生成時の内部状態であるアテンションマップを擬似ラベルとしたペアを利用したセマンティックセグメンテーションモデルの学習手法であるAttn2Maskを提案しています。また、MIRU優秀賞を受賞した発表の１つです。

業務で取り組んでいる問題の一つに、弱教師ありの設定での領域分割があったので最初はその観点で興味を持ったのですが、Text2Imageを使った画像・擬似ラベル生成を使うことで画像のドメインをある程度制御しながら人手のアノテーションなしでモデルを学習する方向性が面白く興味を持ちました。

#OS4A-L2 数式ドリブン教師あり学習によるセマンティックセグメンテーション

篠田理沙 (AIST, 京大), 速水亮 (AIST, 東京電機大), 中嶋航大 (AIST), 井上中順, 横田理央 (東工大), 片岡裕雄 (AIST)

この研究では、数式によってデータの構成要素（ラベルの数や大きさなど）を調整可能なデータセットを作成するSegmentation Radial Contour DataBase（SegRCDB）を提案し、数式ドリブン教師あり学習によるセマンティックセグメンテーションの事前学習を可能にするとともに、学習データにおける重要な要素を実験的に確認しています。

非自然画像による事前学習でもデータの構成要素の調整によって自然画像での下流タスクで精度向上を達成していることから、間取り図といったラベルの収集が困難な下流タスクにおいても提案手法による事前学習データの調整によって効率的に精度向上を達成できるのではないかと期待しています。

#IS2-50 グラフィックデザインの教師ありレイヤー分解

中嶋航大 (サイバーエージェント, 筑波大), 菊池康太郎, 岩崎祐貴 (サイバーエージェント)

この研究では、ラスター画像から前景画像の抽出と背景画像の補完を繰り返し行うことでレイヤー分解を行う手法を提案、広告バナー画像の作成過程から得られるレイヤーデータを教師とする実験を通して手法の有効性を示しています。

グラフィックデザインと同様、間取り図も作成過程ではレイヤーを持つベクター画像ですが、流通するときにはラスター画像になっており再利用しづらいという課題感がめちゃくちゃ分かると思い、紹介させて頂きました。教師データが一般的に手に入るかは難しいところですが、機械学習の問題としてどの程度可能なのかという観点ですごく参考になりました。

おわりに

まずは今回会社の制度を利用して学会に参加させて頂けたことに対して感謝を申し上げたいです。また、現地のポスターセッションや企業ブースで議論や会話をさせて頂いた皆様、ありがとうございました。おかげで現地参加させて頂いた2日間は、発表や交流を通して技術の進展の速さを肌で感じることができ刺激や学びが多い濃い時間を過ごせたと思っています。

AISCでは多様な専門性を持ったメンバーがお互いを補完し合うことができている一方で個々の専門性を尖らせることに関しては課題感を持っていたので、こういったコミュニティを活用することは一つの手段としてとても有効だなと感じました。また、GA technologiesもテックカンパニーとしてコミュニティをテイクするだけではなく、スポンサー活動や発表を通してギブできるように取り組んでいきたいと思っております。

ここまで読んで頂きありがとうございました！