ViEW2023のオーラル発表を終えて


ViEW2023オーラル発表の様子

はじめに

東京電機大学大学院M1/豊田自動織機-産総研共同連携ラボ(ALラボ)RAの大塚と申します.この度,cvpaper.challenge 〜CV分野の今を映し,トレンドを創り出す〜 Advent Calendar 2023の15日目を担当させていただくこととなりました.今回はビジョン技術の実利用ワークショップ(ViEW)2023においてオーラル発表に至るまでの経緯をお話しいたします.

RA採用までの経緯

そもそも著者の大学ではロボットの制御およびメカトロニクスを専門とする学科に所属しておりました.そのため,コンピュータビジョンをまともに学び始めたのは研究室に配属されてからでした.Pythonに触れ始めたのもほぼ同時期でした.プログラミングも得意なわけではなく,どうにかこうにかB4では卒業研究をやっていましたね笑.「後悔先に立たず」とは言いますが,B4のころも含めてもっと勉強しておけばよかったなと思う学部時代でした笑.
少し時間は進み2023年6月ごろ(SSIIの懇親会後の2次会だったように記憶しております)片岡さんからRAに興味がないかというご提案をいただき,手続きを進め,RAに採用していただきました.

RAスタート

2023年8月から,ALラボでのRA活動が開始しました.RA開始以前はどのような研究をするかはまだ未定でした.ALラボでは物流の自動化に関する研究をしているとのことでしたので,そういった内容の研究になるのかなと考えていました.そんな中迎えたRA初日,片岡さんとALラボの前さんとの研究テーマ検討ミーティングで「生成AIを使って3Dのデータセットを作れないか」という案がでました.さらに物流への応用を考えると「インスタンスセグメンテーションタスク」を解きたいということで,「生成AIを利用した3Dデータセットの構築」という研究テーマに決定しました.この時の心境としては「3Dデータを扱える!」ということで,今まで触れたことのない形式のデータを対象とした研究ができることに心を躍らせていました.しかし,実際に研究を始めてみると,3Dデータについての知識があまりにもない...
おとなしく金崎先生,秋月先生,千葉先生による「詳解 3次元点群処理」の教科書で勉強を開始しました.同時並行で3D点群処理に関する論文の調査を開始しました.8月の間はそのような形で調査活動メインの一か月でした.

RAを始めてからと,それ以前(大学の学部4年時代)の研究活動を振り返ると研究の体制が大きく変わったと感じています.一番の変化はメンタリングです.RAをやることで得られる大きなメリットの一つはメンタリングだと思っています.著者の場合,片岡さん,ALラボ所属で僕の上司にあたる前伸一さん,筑波大学博士2年の山田先輩に研究をみていただいています.修士1年の学生一人(著者)に対して研究者1名,エンジニア1名,博士課程の学生1名の合計3人に研究をみてもらえていると考えるとかなりの贅沢ですよね.
さらに計算資源の面でも大学の研究室とALラボでは違いを感じました.何よりもALラボでは産総研が保有するスーパーコンピュータ(ABCI)を利用できるのは感動でした笑.さらにALラボではサーバPCも所有しており充実した研究環境が整っていると思います.
また,これはALラボ特有だと思うのですが,ALラボには豊田自動織機の社員の方(要するにプロのエンジニア)や産総研の職員の方が働いています.学生ながらその中で研究活動ができるというのはとても貴重な経験だと思っています.プロのエンジニア,研究者に交じって活動することは刺激にもなりますし,とても集中できます.ALラボの皆さんは初日から私を温かく迎えてくださいました.
そんなALラボですが現在なんとRAの学生が著者一人だけのようです.RAの募集は行っているようなので興味のある方はぜひ応募してみてはいかがでしょうか!(詳しくはこちら)

ViEWへの投稿ーsubmissionー

9月の中旬ごろ,片岡さんから「大塚君,ViEWにだそう」とお声をかけていただけました(この時RAを始めてまだ1ヶ月半ほど).個人的には対外発表の場を提案いただけてとても嬉しかったのですが,大きな問題としてこの時はまだ,結果が何一つありませんでした.しかし,せっかく投稿するならオーラルに選ばれるくらいのものを目指そうというモチベーションで挑戦を開始しました.そのためにも研究テーマや背景には力をいれました.結果として研究発表のタイトルが「生成AIを用いた汎用3Dインスタンスセグメンテーションモデル」に決定いたしました.

さて,研究テーマと背景は固まってきましたが,問題の結果を出す必要があります.急いで結果を出そうとするも,自分の実力不足を実感しました.あまりにも実装力がない.
このとき,前さんにはとても助けていただきました.(前さんにはこの後もさらに助けていただくことになります.)

ViEWのsubmission執筆に関してですがかなり大変でした笑.今までも卒論やSSII(卒論の研究内容)で文章は書いてきましたが,まだまだ未熟な上に3Dデータを扱う研究なので知見がほとんどありません.片岡さんには短期間ながら10回近く添削していただきました.そして,何とかViEWのsubmissionを提出することができました.

ViEWへの投稿ーcamerareadyー

submissionを提出しひと段落,とは当然いきません.ここから実験をして結果をそろえた上でカメラレディ原稿を執筆する必要がありました.ここでまた大きな問題が一つ発生しました.学習に使用するモデルがABCI(スパコン)上で動かせない.(厳密には学習できましたが,なかなか予約が取れない状況でした.)急遽ALラボのサーバPCで前さんが環境を整えてくださり,そちらで学習を行うことになりましたが,一度に実行できる学習の条件が2つ,しかも1条件あたり3日~4日程度の時間がかかるため,カメラレディの締め切りまで時間との戦いでした.そして,一通り学習結果をまとめカメラレディ原稿を提出.このときの結果は満足のいくものではありませんでしたが,ViEWではひとまずここまでが限界かなといった感じでした.

ViEWへの投稿ーオーラル発表の採択ー

11月に入り,コミュニティ内はCVPRへの投稿モードに切り替わっていました.そのような雰囲気の中,11月上旬頃片岡さんに1on1でミーティングをしていただいているタイミングで一通のメールに気づきました.そのメールの内容は「ViEWオーラル発表の採択」でした.通常であれば吉報だと思われるのですが,何しろ結果が芳しくないため,この時は喜びと焦りと不安とでなかなか複雑な心境でした.翌日,急遽スケジュール調整のミーティングを行い追加実験から資料作成,発表までの道筋を立てました.
ここでまたしても実力不足を感じることとなりました.データセットを構築するコードの作成がうまく行えず...ここでもまた,前さんに助けていただくこととなりました.
正直この時はあまりの自分の力の無さに絶望し,かなり厳しい心境でした.しかし,時間は止まってくれないので,気落ちする自分の心に「今自分ができることをやろう」と何度も言い聞かせていましたね(笑)
発表の2週間ほど前,ついに満足のいく結果を得ることができました!
この時,結果を算出するプログラムを実行するのはかなり怖かったですね.結果が悪かったらどうしようか,常に考えていました(笑)
同時並行でスライド資料の作成も進めており,ようやく結果の表を埋めることができてとても嬉しかったのがすでに懐かしい記憶とは...
最終的にスライドはバージョン15くらいまで修正を積み重ね,ブラッシュアップさせました.資料作成もかなり大変でしたが,とても勉強になりました!「スライドはめちゃくちゃいいものに仕上げる」という気持ちも強かったですね.

いざ発表!

ついに迎えた発表日ですが,確実に言えることが一つあります.
人生で一番緊張しました!
10分の発表に加え5分の質疑応答という15分間の口頭発表ですが,ここまで緊張した経験は今までの人生で初めてでした.
壇上にあがってみるとさらなる緊張と高揚感でなんとも表現しがたい心境でした.
しかしながら,15分という時間は終わってしまうとあっという間でした.発表後はなんだか名残惜しい気持ちもありましたね(笑)

終わりに

今回は「ViEW2023オーラルの発表を終えて」といったタイトルで発表までの経緯を書かせていただきました.格好はつけずできるだけありのままを書いたつもりです(笑)
今回のViEWですが前さん,片岡さん,山田先輩のご協力あってこそのオーラル発表でした.なかなか経験することのできない貴重な体験をさせていただけました.本当にありがとうございました!
RA開始の8月から振り返ってみるとあっという間の4か月間だったように思います.ViEWのオーラル発表までを経験して感じたことは自分の実力不足がとても大きいですが,研究というものの奥深さ・楽しさを改めて知ることができました.実力が追い付いてきたらいったいどれほど研究が楽しくなるのかわくわくしますね!

個人的に今回の発表を通して,プログラミングスキル・実装力が大きな課題として感じました.当然その他にも知識の不足や論文執筆能力などたくさんありますが...
コンピュータビジョン分野では「プログラミングスキル・実装力=実験力」なので,ここの力がないとそもそも研究ができません.そのため,このスキルの強化は最優先で伸ばしていきます!
次に,知識の不足に関してですが,より多くの論文を調査することで知識を増やしていきます!
最後に論文執筆力ですがここはおそらく一番難しいような気がする(そもそも場数を踏みずらい)のでじっくりと鍛えていきたいと思います!

おまけ

cvpaper.challengeでの勉強会

著者はcvpaper.challengeにおいて運営もやらせていただいており,イベントなどの企画・進行などをしております.その活動の一環として勉強会を提案させていただいております.特に10月中旬に開催した「マルチノード学習実装に関してのTips会」は20名ほどの方に参加していただき,充実した会にすることができました.この勉強会では産総研の坂東宜昭さんにご講演していただきました.改めて坂東さん,ありがとうございました!
これからも運営メンバーとして,cvpaper.challengeを盛り上げていきたいと思います!



この記事が気に入ったらサポートをしてみませんか?