国際ワークショップから世界と繋がる
はじめに
cvpaper.challenge 主宰の片岡です。研究コミュニティ cvpaper.challenge 〜CV分野の今を映し,トレンドを創り出す〜 Advent Calendar 2023[Link] の6日目を担当します。今回は、研究コミュニティとして初めて運営主体となり、コンピュータビジョントップ国際会議の一角であるICCV(International Confenrence on Computer Vision)のワークショップに採択され、運営、そして国際連携に発展するまでの話をします。現在、オックスフォード大学 Visual Geometry Group(Oxford VGG; 担当:Christian Rupprecht)とアムステルダム大学 Video & Image Sense Lab(UvA VIS Lab; 担当:Yuki M. Asano)との連係を画策しており、記事の執筆時点では講演・連携に向けた打ち合わせのため英国・オランダ訪問中です。
ICCV 2023 Workshop 採択までの経緯と運営
実はワークショップ開催については2019年にまで遡ります。東工大の井上中順さんを中心として特色のある学習戦略をピックアップするICCV 2019 Workshopを韓国にて開催していました。この時、記念すべき第一回を開催し、次の年に第二回を開催しようとしていたのですが、コロナ禍になり現地に行けないということもあり、開催は見送り、そのまま2023年まで時間が経過してしまいました。一方で、ACCVでの受賞 [Link]、MIT Tech Review [Link] でのフィーチャーなど、数式ドリブン教師あり学習(FDSL; Formula-driven Supervised Learning)が研究分野に受け入れられてきたこともあり、この研究トピック自体を世界に発信するためのワークショップを企画したいと思うようになりました。画像・教師・計算リソースなど、限られたリソースの中で認識・生成モデルを学習する問題設定をピックアップするという雰囲気に拡張して、ワークショップの短縮名も ‘LIMIT’ と命名しました。ICCV 2023 Workshop投稿までの流れをまとめると下記の通りです。時間軸は締め切りまでの時間です。
4年前:ICCV 2019 Workshopを運営
2年前:数式ドリブン教師あり学習(FDSL)がACCV Award
1年前:「FDSL関連のワークショップやりたいですね」程度だった
2~3ヶ月前:「ICCVでワークショップやりたいけどまだ早いかも?」
1週間前(!?):「今しかない、やろう!」
6.5日前:テンプレをダウンロードして書き始める
6日前:日本側オーガナイザ結成、招待講演2人を選定、FDSL論文引用の研究者にメールして追加オーガナイザ・査読者を招集
1~5日前:返信されたメール(人選)を元にプロポーザルを修正
当日:ICCV 2023 Workshop Chairに投稿!
予想以上に投稿数が多く、ワークショップ提案自体の査読が難航したということを後から伺いました。結果通知が延期されていることからもそれは容易に想像できました。また、パリの国際会議場の制限で、130件中52件(40%)のみが採択とのことでした。
ところで、1週間前から思い立ち投稿準備をしたにも関わらず、なぜ採択されたのでしょうか?自分なりに分析してみると「どうせRejectなら自分の好きなようにやろう!」という思い切りの良さが、ワークショップ自体のオリジナリティに繋がったのだと思います。まず、招待講演やオーガナイザについては「FDSL研究を引用している研究者にアプローチする」ことから始めました。FractalDB/輪郭形状を明示的に使っている研究、研究問題設定が非常に似ている研究などに取り組んでいる人を一箇所に集めるためのハブとしてワークショップが機能すれば、と考えていました。また、FDSL論文を引用してくれた研究者への感謝も込めてメールを送り続けていました(この時期、テンプレは使ったものの100件以上は英語の別々のコメントを含むメールを書いています)。研究コミュニティを作る上でも重要なのですが、システム上で機械的に送られたメールよりも、一件ずつ温かみのある文章にて書かれたメールを送った方が返信が返ってきやすいです。査読依頼についても同じことが言えると考えております。さすがに数千件以上の投稿を控えている国際会議レベルでは難しいですが、投稿数十件レベルの国際ワークショップであれば、その後の関係性も考えて直接送り続けていきたいな、と考えております。
一件一件メールを書いて送ってみると、時差があるにも関わらず一瞬で返ってくるメールも何件かありました。大体の研究者はメールを丁寧に返信してくれて「FDSLを提案してくれてありがとう」「おかげで論文をトップ国際会議に通すことができました」など連絡が届いて、ワークショップ投稿した時点で、すでに良いことをした気持ちになりました。中にはどうしてもその時期忙しかったり、個人的なご都合で受けられないというメールが届いたりもしましたが、やはり激励のコメントも含まれていることが多かったです。査読者はトータルで70名程度集めましたが、それでも投稿された40論文を捌くのは相当に困難なことで、より多くのコメントや緊急時のフォローを実施するにはこの倍は必要であることがわかりました。‘LIMIT’ の研究コミュニティとしての知名度と参加人数を増やしていくことが、次回国際ワークショップ開催のキーであることに間違いありませんね。
国際ワークショップ運営を主導的に進めてくれたのは博士課程の産総研リサーチアシスタント(RA)である中村凌くん(福岡大)[Link]、山田亮佑くん(筑波大)[Link]、篠田理沙さん(京都大)[Link]の3名でした。特に、中村くんはこの中でもリーダーシップを発揮してくれて投稿システムの管理を担当してくれました。査読締め切り前のレビュー不足にも即座に一緒になり対応してくれたおかげで Notification を常識的な範囲で返却することができました。スポットライトの発表資料提出にも一役買ってくれたりと、国際ワークショップ開催に大きく貢献しています。また、篠田さんはスポットライト発表資料提出のみならず、当日オーラル発表の司会進行を担当してくれました。さらに、中村くん・篠田さんは ICCV 2023 本会議にもそれぞれ主著で論文が採択された(OFDB / SegRCDB)こともあり、ICCVに対する貢献度は非常に大きいと言えます!山田くんは夏季インターンシップもあり国際ワークショップ運営の後半やICCV 2023には現地参加できませんでしたが、それまでFDSL研究を推進してくれたことが大きな貢献であり、今後もこの分野での活躍が見込めます。ぜひご期待ください。
実は、この国際ワークショップの学生運営メンバーについては、cvpaper.challenge Conference(CCC; 直近開催 CCC Summer 2023)[Link]のGeneral Chair / Program Chairの経験者から選出しています。すでにCCCを始めた2021年の時点ではRAとともに国際ワークショップを共同運営したいと思い、ICCV 2023 にてそれが実現した形になりました。RAとはいえ学会運営を学生にさせるという点については、賛否どちらもあると思います。しかし、研究者の人材難が叫ばれる昨今においては、運営マインドを持つ研究者を輩出させるメリットの方が上回ると考えます。さらに、この運営マインドは研究プロジェクトに通ずるものがあるという点でもそうですし、実は運営を通してメンタークラスの人と多くコミュニケーションが取れていて、考え方をインストールしたり、直接メンタリングを得る機会が増えるという意味で研究成果が出ているのではないかということもあります。
↑CCCに限らず、 cvpaper.challenge の運営(今で言うところの事務局メンバー)は常時募集しています。現状は研究メンバーと同じプロセスで募集しているので遠慮なくご質問・ご連絡ください。
また、なかなか海外メンバーを紹介する機会もないので、数行程度ですが日本以外から参画してくれた国際ワークショップメンバーも紹介します!
Dan Hendrycks(Director at Center for AI Safety):2022年UCバークレーにて博士号(Ph.D. in Computer Science)取得。2022年にAIによるリスクを低減するための組織Center for AI Safetyを設立。BERT/ViT/GPTなどに用いられる活性化関数GELU、ロバストAIや分布外検知のための世界的なベンチマーク(ImageNet-C/Aなど)を提案。昨今ではイーロンマスクが設立したxAIのアドバイザを担当、Grok-1の開発にも貢献。
Xavier Boix(Research Scientist at Fujitsu Research):2014年ETH Zurichにて博士号取得。シンガポール国立大学博士研究員、MIT研究員を経て現職。神経科学の観点から深層学習を研究。
Connor Anderson(Ph.D. Student at Brigham Young University/Intern at MIT-IBM Watson AI Lab):数式ドリブン教師あり学習の研究に従事。WACV'22に主著として採択。これからも、同様の国際ワークショップを開催していくモチベーションはあります!我々も含め、これからの動向にも要注目ですね。
国際ワークショップ開催の意義とコツ
国際ワークショップ開催の意義についても触れておきます。国際ワークショップと言っても、そのタイプはさまざまで、代表的な例を言うと、招待講演のみで構成されているもの、招待講演と投稿論文からの発表を組み合わせるもの、さらにコンペティションの結果とその発表をピックアップするもの、の3つくらいが標準的な国際ワークショップの形式です。他には論文の書き方、査読の仕方など、この分野としての研究者としてのあり方をまとめた集まりもあったりします [Link]。
とはいえ、どのワークショップも根底にあるのは「その特定研究トピックを盛り上げ、世界に仲間を増やす」ということです。世界には、研究トピックを同じくする仲間がいます。そして、国際ワークショップはそれらの人々を繋ぐ役割もあるので「国内に仲間がいない」と感じる人は、そのワークショップに投稿したり、現地に行けなくても意見交換だけでもしてみると良いと思います。「ここに同じことをやっている仲間がいる」ということをアピールする絶好の機会になります。
また、国際ワークショップから次のトレンドが生まれる例もあります。そう、ImageNetコンペティション(ILSVRC; ImageNet Large-Scale Visual Recognition Challenge)[Link]からAlexNetが生まれ、第三次AIブームに繋がったことが最も有名な例です。国際ワークショップのオーガナイザも、なんとかこの技術を次世代のトレンドとして入れたい、競技人口を増やしたいと考えている人も多いです。仲間を集め、技術自体を拡張し、次世代のトレンドにすると言う姿勢は見習いたいです。
一方で、ぜひ「私も国際ワークショップを開催したい!」という方が増えてほしいと思っているので、国際ワークショップ開催のコツについてお話しします。ポイントになってくるのが「国際ワークショップのテーマ設定」と「その国際ワークショップが信頼に足るか」です。
「国際ワークショップのテーマ設定」は想像に難くないと思います。研究分野においてどのようなサブトピックを扱うのか、どのようなモチベーションで今後研究していく必要があるのか、どのような人がターゲットになっているか、招待講演はどなたを呼ぶのか、など基本的な部分を問われていますし、国際ワークショップ自体の面白さや重要性もこの部分で出すことが多いです。
「その国際ワークショップが信頼に足るか」は、本当にそのオーガナイザは国際ワークショップ運営ができるのか、と言うことを見ています。つまり、Webpageの情報更新や、投稿がある場合には査読を捌けるか、招待講演者とは連絡を取り合える状態にあるか、など。「国際ワークショップのテーマ設定」が加点方式だとすると、こちらは減点方式というイメージです。
オーガナイザならではの特色のあるワークショップにする工夫は必要であれど、研究者なら頑張れば提案自体までいくことはできます。ぜひ、発表者側で止まらず企画側に回って分野を動かしていきましょう!
Oxford VGG / UvA VISLab との国際連携
国際ワークショップでの連携もあり、研究連携の実現に向けて11月末に招待講演・打ち合わせ込みのUvA VIS Lab・Oxford VGG訪問が実現しました。国際ワークショップ企画、採択(2023/04月頃)から連携発展までの経緯は下記の通りです。
2023/06月中旬:バンクーバー開催の CVPR 2023 にて片岡とOxford VGGメンバーが交流。1時間くらい雑談するチャンスを得る。
2023年06月末:Yuki M. Asano(Asano-san)から「コラボしましょう!」との旨のメールが来る。(元々FDSL論文を引用してくれたり、こちらからAsano-sanの論文を引用したり認知していた)
2023年06月末:片岡から Christian Rupprecht(Chris)に「予算申請するからコラボしましょう!」と連絡。快くOK。
2023年09月:複数提出した予算のひとつが採択。
2023年11月末:UvA, Oxford VGG訪問、招待講演や打ち合わせを実施。
2023年11月末:Oxford VGG滞在中にふたつめの予算が採択。
研究連携については、CVPR直後の6月末に一瞬で決まっています。やはり直に会って考えを共有することは重要ですね。また、11月末のOxford VGG訪問では、この分野のアイコン的存在の一人である Andrew Zisserman に会ってトークを聞いてもらうことができ、その後資料共有のご依頼を頂いたので、こちら[Talk Slide] [Full Slide]のスライドを共有しています。
ですが、本当の始まりは、私が2013, 2014年に独国・TUMに短期研究留学したところからでした。実は研究室の同室で研究していた大学院生が Chris であり、のちのOxford VGG の准教授です。その後も、CVPRやICCVなどで会うたびに近況を報告してはいましたが、ICCV 2019 Workshopでは査読を依頼、コロナ禍に入ってしまいましたがChrisがCVPR Best Paperを獲った時にも連絡を入れていました。ICCV 2023 Workshop では招待講演をお願いしたところから連携が始まっています。「海外留学の繋がりは大事にせよ」とはよく言われることですが、ここにくるまで10年の蓄積が、大きく身を結びました。もちろん、これがスタート地点なので、この火を絶やさず大きな流れにできるよう尽力いたします。TUM滞在の様子については「CV分野メジャー国際会議受賞 / トップジャーナル採択までの道のり[Link]」もご覧ください。
まだ連携が始まったばかりなので、多くをお話しすることができませんが、やはりChris, Asano-sanの強みも活かせるようLIMIT Workshop [Link] に関連した研究内容を模索しています。日本側からのみならず、Oxford VGG / UvA VISLab からも学生さんが参加してのコラボなので、双方本気で取り組めるような環境を作って行けたらと思います。今後の動向にもご期待ください!
また、もちろんOxford VGG / UvA VISLab との研究連携にご興味をお持ちの方がいましたら、片岡までご連絡ください。cvpaper.challenge 研究メンバー、産総研インターン、産総研リサーチアシスタントと段階的にポジションもご用意できますのでまずは遠慮なくご連絡ください。
おわりに
まずよくご質問を受けるのが「片岡さんはもともと英語ができるから海外連携を進められるのでは?」という点です。全く違います。わかりやすいスコアで共有すると、大学学部生の時点でTOEIC 290、大学院修士課程時点では何回受けてもTOEIC 400点台でした。転機は博士課程最初の年で、グローバルCOEのRA制度によりカリフォルニア大学リバーサイド校への滞在が決定しました。大体8ヶ月間の滞在だったので英語を習得するには十分とは言えないのですが、朝早くにオンライン英会話で基礎を学び、その足でカフェに行き会話・英語の論文を数本読んでから研究室へ、ラボではミーティング・ランチ・雑談を行い、夕方ジムに立ち寄り、夜は夕飯を作り研究をしてから寝るという生活を送っていました。検索ワードや研究ノートなど、思考を全て英語に変えたことや、日本人が少ないカリフォルニア大学のキャンパスで日本語のコミュニケーションが皆無だったこともあり、帰国直前にはそれなりに話せるようになっていました。この滞在話はまだどこにもオープンにしていないので、もしご希望あれば何かのタイミングで書きたいとも思っています。
しかし、それでも帰国後はすぐに英語を忘れていきます。日本ではオンライン英会話で繋いでいたとはいえ、日常のほとんどを日本語のコミュニケーションに置き換えてしまってからは徐々に忘れていくことが止まりませんでした。実は今も英語の招待講演の前には「ちゃんと英語が出てくるかどうか」「質問が聞こえるかどうか」が少し不安になり、事前準備に多くの時間をかけてから臨んでいます。日本語の講演時には何回か講演したことのある内容だとほんの10分くらい資料を見返すくらいで問題なく講演できるので、英語がもっと上達すればそのレベルまで行けるのだと思いますが、まだまだ先の話か、一生来ない領域のような気がします。
でも、そんな英語レベルでも勇気を振り絞って前に進み続ければ国際連携は夢ではないところまで来ました。結局はお互いにメリットがあるかどうかなので、英語力は最低限以上、研究力は最大限のものを提供していく、というスタイルの方が成功しやすいと思います。今回の場合、それはドイツ・ミュンヘン工科大学への訪問から始まり、国際会議での定期的な顔合わせ、そして今回のICCV 2023 Workshopやオックスフォード大学・アムステルダム大学訪問を経ての国際連携に至ったわけです。
私は何かの分野で国際的に活躍することが子供の頃からの夢のひとつでした。途中で英語が全然できないと気づいて絶望し、夢が何度も見え隠れしながらも、研究力を向上させつつ積極的に動くことで、ここまで持ってくることができました。
参考
ICCV 2023 速報 [Link]:「経緯」「おわりに」については、ICCV 2023 速報からの転載を含みます。
この記事が気に入ったらサポートをしてみませんか?