ICCV採択記

こんにちは!京都大学D2の篠田[Link]です。研究コミュニティ cvpaper.challenge 〜CV分野の今を映し,トレンドを創り出す〜 Advent Calendar 2023 の10日目を担当します。この記事では、ICCV'23に採択されたSegRCDB[Link]、そしてcvpaper.challengeを中心とした研究生活の話をします。

採択論文(SegRCDB)について

実画像を用いずに事前学習を可能にする数式ドリブン教師あり学習をセグメンテーションの分野に応用した研究です。領域分割では物体同士の境界部分、つまり輪郭に注目することが大事なのではないかという着想から始めています。領域分割というアノテーション作業が負担となる分野だからこそ、アノテーションゼロで大量のデータが作成できるという利点があります。標準的データセットであるCOCO-Stuffと同枚数(約11.8万枚)で比較しても、より高い学習効果を得ることができます。Githubコード[Link]では、さまざまな要素を引数として変えられるように設定してあります。下流タスクに合わせて最適なデータセットを作成できるパイプラインとしての利点もあります。商用利用も可能なので、ぜひお使いください。

 採択までの研究生活

D1の夏に産総研RAに採用されました[昨年記事Link]。
私は修士課程までGPUを使っておらず、自分で買った最弱スペックMacbookで数日かかっていた処理がABCIを用いれば一瞬で終わってしまうのを目の当たりにして非常にショックを受けました。また産総研RAになるとストレスフリーなパソコンも支給してもらえ、私の実力は変わらずとも研究の進捗が飛躍的に向上しました。(ちなみに所属研究室は農学研究科であり、画像の研究を行っていたのは私だけだったので所属研究室に非はありません。)

初めは環境分野×CVに専念しても良いかと考えていましたが、周りの学生の進捗報告が楽しそうで、私も画像分野に特化した研究を始めたいと片岡さんに申し出ました。他分野への応用の研究だけに取り組むと、私には根本の理解を怠ってアウトプットを出してしまう癖があることに気づいたため、実力をつけるための良い挑戦だとも考えました。

私は所属研究室が同じ人がcvpaperにいないため、プロジェクトチームの立ち上げも経験することができました。RCDBに詳しい速水君、実装に詳しい中嶋さんに声をかけ、片岡さんに許可をもらいプロジェクトを本格的に始めました。

セグメンテーションデータセットはFDSLで今まで試されておらず、結果が出るかはかなり不安なスタートでした。事前学習効果が何もでない時期もあったのですが、諦めずに改良を重ね、夏が終わる頃には既存の有力なデータセットの効果を超すことができました。CVPRを目指すことにしたのですが、どう考えてもギリギリなタイムラインであったため、ここでも片岡さんに頼み、東工大の井上先生と横田先生に共著に入っていただきました。共著陣のサポートもあり、CVPRに無事投稿できたものの、絶妙なラインの一文がブラインド違反と判定されdesk rejectとなってしまいました。反論したものの覆らず、自分の執筆のせいでご迷惑をかけ、共著の方々にも申し訳ない気持ちでした。ただ井上先生に同じ論文を出版するなら、どうせならクオリティが上がったものを出版したいよね、と言っていただき(みなさん寛大で頭が上がらないです)、その言葉に救われ、気持ちを切り替えて改良を重ねていきました。

CVPR'23 Workshopには筑波大の山田くん(NAS Workshop)、東大の塩原君(CV4Animals)とのそれぞれの共同主著を出しました。バラのデータセットに関する論文(Woman in Computer VIsion)も出したりと落ち込みを晴らすかのように働いていました。このバラデータセット[Link]のアノテーションは大変細かく、外注せず自分でbboxをつけた思い出の研究です。ぜひ使って頂けると喜びます。

もちろんICCVに向けた改良も続け、満足のいくものを提出できました。リバッタルでは特に井上先生に実験の構成を見ていただきました。結果、無事採択され、本当に挑戦して良かったと思います。業績としてはもちろんですが、それよりも私の可能性を信じてくれた片岡さんをはじめとする先生方に良い結果を報告できたことが大きいです。産総研からもプレスリリースを発表していただきました[Link]。発表当日は、引用していたCityscapes[Link]の著者がポスターを探してディスカッションに来てくれたりと、とても充実した時間でした。

その後

トップ会議に通ったら自分に自信がつくのだろうと思っていたのですが、実際には自分の足りない部分を改めて実感する機会でもありました。足りない実力を補うため、今度はモデル側にアプローチする研究もするべきだと思い、研究テーマを大きく変えてできることを増やそうとしています。

研究だけではなく、CCC Winter[Link]、MIRUチュートリアル[Link]などのGeneral Chairや、ICCV'23 Workshop[Link]のOrganizerも務めさせていただき、仕事の取り組み方も学んだ一年でした。4月からは東工大の篠田研でのRA、 12月からはオムロンサイニックエックスでのインターンも開始して、新しい環境にも飛び込んでいます。修士課程のときには一緒に研究ができなかった情報系の研究者に囲まれている毎日はとても楽しく、1日1日が過ぎてしまうことに悲しさも感じています。私のことを信じて自由に研究させてくださる大学の先生がいてこその環境でもあるので、博論もできるだけ良いものを提出したいと思います。

私は農業の人というイメージを強く持たれがちですが、どちらかというと専門は環境工学であり、最近は動物分野の画像認識にも乗り出しています。ぜひ植物や動物のデータを持っているけど活用に悩んでいる方などいらっしゃいましたらお声掛けください。また良い報告ができるように来年も進めていきます。最後になりますが、今年一年、関わっていただいた皆さんありがとうございました。来年もcvpaper.challengeのさらなる飛躍に貢献できるよう頑張ります。


 ICCVポスター会場にて

この記事が気に入ったらサポートをしてみませんか?