TDU-Vision:東京電機大学の新規CV・AI研究コミュニティ
東京電機大学(Tokyo Denki University; TDU)修士1年 / 産総研リサーチアシスタント(RA) / TDU-Vision 共同主宰の松尾雄斗と申します。本Advent Calender (AD)の主著です。共著はTDU-Vision共同主宰の大塚大地先輩です。TDU、中村明生研究室の一学年上(現M2)の先輩です。本文中の一人称(私・自分)は原則、松尾を指します。
本ACでは、今年(2024年)から活動を開始したTDU発の学内研究コミュニティ:TDU-Visionの挑戦と現状について概説します。今年については、メンバーの知識量の大幅向上を狙い、まずは1,000本という膨大な数の論文読破を試みておりました。
……結論から言うと、能力を大幅に凌駕する野心的すぎるタスク設定であったためか、TDU-Vision における最初のチャレンジは失敗しそうなのですが、個人的には知識の幅が広がり、研究に対する姿勢に良い変化が得られたということや、研究コミュニティ運営の難しさを知れたことなど、多くの学びを得たという意味でポジティブな面が見えてきたので、それらを今回のACにて共有させていただきます。
なお当記事は、cvpaper.challenge 〜広がる研究コミュニティー〜 Advent Calendar 2024 [Link] の12/2分の記事として公開しています。
TDU-Visionとは?
TDU-Visionは、東京電機大学(Tokyo Denki University; TDU)の視覚認識・理解研究(Vision)、深層学習系統の研究(いわゆるAI)を専門とする研究室を集めたコミュニティです。現在は下記5つの研究室が所属しています。(名前順)
大山研究室(システムデザイン工学部情報システム工学科)[Link]
:パターン認識、機械学習、メディア処理に関する研究小篠研究室(システムデザイン工学部情報システム工学科)[Link]
:実世界センシングによるデータ収集と認識金子研究室(未来科学部情報メディア学科)[Link]
:メディア情報処理、パターン認識、機械学習に関する研究中村研究室(未来科学部ロボット・メカトロニクス学科)[Link]
:FDSLを始め、画像識別、物体検出タスクをメインに研究前田研究室(システムデザイン工学部情報システム工学科)[Link]
:画像、言語、時系列など様々な分野における機械学習の研究
この研究コミュニティの発端は2023年10月26日、片岡裕雄氏(産総研 上級主任研究員 / オックスフォード大学 Academic Visitor / TDUにおいては客員准教授)、速水亮氏(当時M2、TDU中村研)、髙橋秀弥氏(当時M2、TDU前田研)と大塚大地先輩(当時M1、TDU中村研)の4名によりcvpaper.challengeについての講演を上記5つの研究室を同時に集めて実施した会です。
また、この会では各自の研究テーマについて発表することはもちろんですが、研究コミュニティとしてTDUとcvpaper.challenge の関係・歩みを紹介するとともに,実際にcvpaper.challenge に参加することで感じたことについて、各講演者が発表しました.特に印象的だったのは、示し合わせたわけではなかったものの、学生は共通して「集合知の良さ」についてお話しされていたことです。他学部・他大学など所属や経験が異なる学生同士が交流を持ち、さらには企業や研究機関の研究員や大学教員などのメンタリングを受けることによる相乗効果について、その一部ではあるものの、講演を通して知ることができました。
上記5研究室について、実は着任されてから数年単位の先生も比較的多く、研究室自体にそこまで人数が多いわけではない中、上記の講演会では合計で60名以上の聴衆が集まりました。CVPR / ICCVなどへの論文投稿、参加までの講演内容はもちろんですが、何より研究コミュニティへの関心が高く聴衆の興味を引いたのではないかと思います。
電大とcvpaper.challengeの歩みに関してはTDU中村研OBの宮下侑大氏によるこちらの記事で詳説されているのでぜひ合わせて読んでいただけますと幸いです.「cvpaper.challenge 創設のアナザーストーリー」と銘打ったこの記事は、研究コミュニティの創設時の話を学生側から俯瞰して見た良記事です。「一人で絶望するのではなく、みんなで絶望することで逆に気持ちが保てた」ということ、「サーベイで得られたもの」として知識量のみならず研究論文へのライティング能力、問題設定能力など、研究活動に必要な基礎能力が学生でも高いレベルで備えることができると実証して見せた、ということが記載されています。
上記講演会終了後、「これだけ盛り上がったのであれば」ということと、「学生側からボトムアップに5研究室の集合知を出せる環境を整えよう」ということでSlackを設置、TDU-Visionという名前を付けて活動を開始したのでした。
「High-impact Paper 1,000本読みます ※1」
2024年7月26日 (金)に開催したイベント「cvpaper.challenge Conference Summer 2024 (CCCS 2024) [Link]」にて、CV・AI界隈の著名な方々(金出武雄先生をはじめとする堂々たる研究者等)の目の前で、「論文1,000本読破します!」と声高に宣言しました※2。
※1 High-impact Paper 1,000本については、cvpaper.challengeがCVPR 2015完全読破達成後に挑戦して失敗しているプロジェクトです。具体的には、CVPR、ICCV、ECCVそれぞれにおいての採択論文の中で、過去5年間で最も引用されている論文を上から読み尽くしていくというチャレンジです。
※2 この宣言に対しては、CCCS 2024の際に金出先生から「素晴らしい取り組みなのでぜひ進めるべき」というコメントとともに、「CVPRへの投稿を増やせると良い」というアドバイスをいただきました。
CCCS 2024、「TDU-Visionについて」の発表で使用したスライドはこちらをご覧ください。
個人的には、このチャレンジは2024年内に達成できると7月の時点では信じていました。TDU-Visionには40人以上のメンバーが所属していて、かつ、単純計算では7人が1日1本論文を読みまとめれば、年内に1,000本まで到達すると考えていたためです。しかし、「信じていました。」という書き方でわかるとおり、現在(本AC投稿時)は、今年中に読破は困難だと思っています。この理由は後述、「コミュニティ運営の難しさ」にて説明します。
(1人で)100本超読破すると訪れる良い変化
私は、速読・精読含めて約100本読破したあたりで、明らかに研究に関わる自分自身の能力が向上していることを実感しました。多数の論文速読により、いわゆる広い視野が身に付いたのか、CV研究に関わる議論力、理解力が向上し、それを仲間の研究に還元できるようになっていました。特に、自分の専門外の研究でも要点を掴み、コメントを残せるようになったことに自分自身驚きました。
加えて、特定の論文の精読により、クオリティの高い論文の文章構造、論理構成についての理解が深まり、自分が論文を書く際の基準が出来上がったように思います。精読では、「この論文、なんか好きだな」と思う論文に対して、なぜ好きだと思えるのか、なぜ読みやすいのかを徹底的に分析することにより、どのような文章構成の論文が読者を惹きつけるのか、インパクトを与えるのかを理解することに注力しました。数本の論文精読を通して、論文の書き方、読み方がわかるようになり、論文執筆において手が止まることが少なくなったと実感しています。ちなみに論文精読については、CV研究の大御所がこちらの記事 [Link] にて、より具体的に解説してくださっています。論文読破を通して自分が到達した”精読のポイント”と近いことを大御所が言っている!という事実は、私の自信の源になっています。(根拠のある自信って良いですよね。自分の芯が持てるというかなんというか。)
宮下氏も4ヶ月で200本弱の論文を読破し、論文読了までにかかる時間を1日単位から1時間以内にしたこと、論文構成能力向上、研究アイディアの発想力...と伺い、私も早くその本数まで到達して良いメリットを享受できるように頑張ります。
コミュニティ運営の難しさ
読破には当然時間がかかります。そのため、それなりに忙しい大学院生が”自分の時間を費やすだけのメリットがあるのか”を先に考えるのが普通のようで……メリットを提示してくれと言われることが多くありました。さらに、各自の研究テーマを持つ院生が、自分の研究に(一見)関係ない論文を読むことは、時間の無駄として認識されやすかったです。
実際にはCV・AI関連の論文を対象にしているため、どの論文を読んでも知識が無駄になることは全くないのですが、私自身、このチャレンジが無駄ではないと認識できたのは50本以上の論文を速読、5本以上の論文を精読をした後だったため、TDU-Visionメンバー全員に最初からメリットを提示することは難しく、現在もどうすればこのチャレンジへの賛同者、参加者が増えるのか苦悩しているところです…。
まとめと今後の方針
CV・AI論文1,000本読破に挑戦。速読+精読の効果により、論文執筆、研究力強化にはつながっている。ただし、このチャレンジのメリットをTDU-Visionメンバーに周知し、共に読破を進める人を集められなければ達成は難しい。というところが、現状のTDU-Vision活動まとめとなります。
今後の方針として、大前提はこのコミュニティの存在を持続させること。そのために次に取るべき行動を、HQを中心に計画・考案中です.特に、これからさらに本格的に研究を進めるM0(大学院進学予定のB4)生や、これから研究を始めるB3生をどのようにコミュニティに巻き込んでいくかが重要だと考え、cvpaper.challenge所属の先輩方、研究者方からアドバイスをいただいている段階です。
近いうちにcvpaper.challengeと並ぶ、CV研究界において名のあるコミュニティにまで成長できるよう、工夫していこうと思います。