BMVC2023に採択された話

はじめまして! cvpaper.challenge 研究メンバー/産総研技術研修生の田所と申します. cvpaper.challengeアドカレ2023の7日目では, 画像認識分野の国際会議 British Machine Vision Conference (BMVC) 2023 Oralに採択された研究についての話をしていきたいと思います. 本記事を通して, cvpaper.challenge 研究メンバーとしての研究の進め方の一例をお伝えできればと思います. 


研究内容について

今回採択された研究は, “Primitive Geometry Segment Pre-training for 3D Medical Image Segmentation”という3D医療画像セグメンテーションにおける研究です. この研究について一言で言うと, “3D医療画像セグメンテーションモデルを, 原始的な3D形状を利用したセグメンテーションタスクにより事前学習する手法“です. 3D医療画像セグメンテーションでは, 教師ありデータのみならず教師なしデータですら入手が難しく, 近年発展している自己教師あり学習による事前学習においても, 学習に用いることができる3D医療画像には限りがあります. 本研究は, 3Dセグメンテーションモデルに基礎的な3D形状認識能力を与えるような事前学習を行うことで, 上述のような問題を軽減することがモチベーションとなります. 検証の結果, ランダムパラメータから学習した場合と比較して性能向上が得られました. さらに, 3D医療画像を自己教師あり学習によって事前学習した場合と同等以上の性能を発揮しました. 今回の研究は, 僕の所属している研究グループの提唱している数式ドリブン教師あり学習(FDSL)をベースとして, 医療分野に応用したものです. 興味を持っていただけましたら, ぜひMain text / Supplementary materialsもご覧になってください. 

採択までのストーリー

自分は2年ほど前からcvpaper.challengeで研究を進めてきました. ありがたいことにABCI (産総研のスパコン)を使わせていただけたり, 先生方からのコメントを頂けたりしました. とはいえそこまでサクサクとうまくことが進むわけではなく, 昨年は特に研究のつらさを体験した1年でした. 今年2023年は, そこから得た反省点を踏まえて研究していくという心がけでいました. 自分の中での大きな反省点は, 最初から一人で研究しようとしていたことです. 置かれている環境を考えると一人で研究することも致し方ないというのはあったのですが, その現状だと進歩がないことを確信していました. そこで, 長期休みに産総研現地に行って泊まり込みで研究をしたりなどした結果, 最強メンバーである山田亮佑さんと研究を行わせていただけることとなり, このことで研究のペースが著しく向上しました. 最初の目標地点は画像の認識・理解シンポジウムMIRU2023への投稿 (3月締め切り)でした. 今年の1月に産総研のさくら館に泊まり込み作業したときは, 綿密な1on1を重ね, 研究を磨いていきました. この時期は産総研での作業も1日中行っていましたが, 産総研現地の山田さんや中村凌さんに食事やサウナに連れて行っていただいたりもしました. 今思えば, そこでの雑談ベースのディスカッションは意外と大きく研究に寄与していたなと思います. 仙台に帰った後も, オンラインで1on1を重ね, 無事4ページの日本語原稿をMIRUに投稿できました. 光栄なことに, MIRUでは採択率約16%のLong Oralに採択され, 学生奨励賞をいただくことができました. MIRU投稿後は, 研究を拡張させてBMVC2023 (5月締め切り)への投稿を目指して研究を進めていきました.  ここでも様々な壁がありましたが, 最も苦労した点は手法部分の執筆です. 手法部分は独自のものであるため, どのように書くのかという正解がなく, なかなか参考にできるものがありませんでした. 初稿を書き上げてからも, 納得のいくような文章・図にすることができず, 投稿直前まで何度も推敲を行いました. BMVCでは中嶋航大さんと中村さんも共著としてご協力いただけたこともあり, なんとか投稿までいけました.  7月に査読結果が返ってくると, 3人の査読者からの評価はAccept (5/6), Reject (2/6), Accept (5/6)で, Rejectがついてしまったことで落ち込んだのを覚えています. Rejectの評価がついた原因は, 論文のClarityの問題についてでした. Rebuttalは一週間しかなかったのですが, Rejectを何とかひっくり返したい一心で, この一週間は人生でもトップレベルでがむしゃらに頑張りました. Rebuttalの末, 幸いにもRejectをAcceptにひっくり返すことができ, Accept×3でBMVCに採択となりました. さらに, 採択論文の中でも1/5に割り当てられる口頭発表に採択され, この通知が来たときはかなり嬉しかったです. 

今回の反省点

今回, 研究していく上で自分に足りていないものを痛感する機会が多かったのですが, 特にクリティカルであると感じたのは以下の3点です.

ディスカッション能力
十分な能力があれば一人でも黙々と研究を行えるのかもしれませんが, 現状の自分はそうではないという自覚がありました. 今回は運よく山田さんと研究を行わせていただきましたが, 今後も自ら議論を持ちかけられる積極性は持たなければいけないと感じました. また, 先生にコメントをもらうときも, なるべく情報負荷を下げてクリティカルなフィードバックがもらえるように自らを最適化していく必要があることも改めて実感しました. しかし, この点については置かれている環境等に依存することもあるため, 自分にとって最大限できることを考えて, 時に人を頼ってみるという積極性と運が大事だと思いました.

科学としての研究
ここについては山田さんをはじめとしてよく指摘されました. 機械学習の研究では精度が上がれば良いという考え方もあるとは思いますが, それだけではなく, “なぜその手法なのか?“, “その手法でなぜ性能が向上するのか?“というさらに情報学的に踏み込んだ視点を持って研究を行うことの重要性も感じました. また, 今まではCVPRやNeurIPSの論文を読んで, 複雑な図を見てかっこいいなと感じたり, これこそがいい研究なのだなという先入観を持ったりしていましたが, “シンプルかつ効果的“というのも研究の重要な側面であることを理解しました. とはいえ今回採択された研究でも以上で述べたようなことができているというわけではなく, より科学的な視点を持って研究をできるようになりたいです.

執筆
過剰に言いすぎないまでも読者に注目して読んでもらえるようなストーリーや, 相手に伝わりやすいような文章を心がけて論文を書くには何度も推敲を繰り返す必要がありました. BMVCの文章も何回もコメントをいただき推敲を重ねましたが, カメラレディ投稿後もまだここをこうすればよかったなと感じることがあります. また, 図に関しても, イントロにはどういう図を載せるかということに加えて, 読者の目を引くような図にすることも論文を知ってもらうということに関しては重要です. 自分の作成した図を山田さんに手直されたときの, ビフォーアフターの差に無力さを感じることもありました. この点についてはまだまだ経験を積んで最適化していく必要があります. 

遠方からのcvpaper.challengeでの研究

僕が他のcvpaper.challengeの研究メンバーと異なる点は, 産総研から離れた遠方からオンラインで研究をしている点です. オンラインでの研究はオフラインと比較すると厳しい点もたくさんあります. 特に, 雑談ベースのディスカッションの機会が減ることは大きな機会損失になっていると感じています. しかし, cvpaper.challengeには多くの実力のある研究メンバーがおり, わからないことがあったら相談できる環境があります. 長期休みには産総研のさくら館に宿泊して現地での研究もできますので, 工夫をすれば僕のように遠方からの参加も可能です. また, 僕を含めて情報系を専攻していない学生も複数いるため, コミュニティの門戸は解放されていると感じています. 画像認識分野の研究に興味があれば, ぜひ入ってみてください!

さいごに

研究は, サーベイから始まり, 実装や実験計画, 執筆, 図のデザイン, そして, 研究仲間とのコミュニケーション能力など多角的な能力が必要であることを改めて痛感しました. また, 何回も繰り返していかないとこれらの能力を十分に成長させられないことも感じています. より大きな影響を与える研究を目指し, 自分の研究のやり方も最適化させていきたいと思います.

この記事が気に入ったらサポートをしてみませんか?