医療分野から研究するコンピュータビジョン領域

こんにちは!東北大学4年の田所と申します。現在はcvpaper.challenge 研究メンバー / 産総研 技術研修生として活動をしています。

本記事は、研究コミュニティ cvpaper.challenge 〜CV分野の今を映し,トレンドを創り出す〜 Advent Calendar 2022の16日目の記事です。私は、機械学習ではなく医療分野を専門としています。今回は、医療系学生のcvpaper.challengeへの関わり方などを述べていきたいと思います。医療系学生の方々はもちろんのこと、機械学習を専門としていない他分野の学生の方々の参考になる記事にできたら幸いです。

cvpaper.challengeへの参加まで

私は1年生の終わり頃から機械学習について、独学を始めました。はじめから研究室等に参加することも検討したのですが、ある程度の基礎を身に付けてからがいいかなということで、機械学習についての本を読み漁ったりpythonで色々実装したりしていました。そして2年生の最後くらいから、大学の学部内で機械学習が身につけられそうな研究室を探し出して入りました。また、他の複数の研究室も訪問したりして、どういった研究室があるのか大体把握しようとしました。どの研究室も、機械学習についての勉強会を定期的に開催していたり学部生を積極的に受け入れてくれたり、とてもいい環境であったと思います。そこから1年くらいを経て、3年生の後半にcvpaper.challengeに参加しました。

ここで、なぜcvpaper.challengeに参加しようと思ったのかについて説明します。ここから話すことはあくまでも研究・機械学習ド素人の僕が感じたことなので、もしかしたら間違っているかもしれません。

医療分野に限らず、他分野×機械学習の研究では、
1. 新たなタスクを設計する研究
2. 既存のタスクの精度を向上させる研究
3. データから新たな知見を得るデータサイエンス的な研究
の3種類が主にみられると感じました。機械学習を用いた研究を行っている医療系の研究室では、1と3が主に行われている印象を受けました。それに対して2は機械学習を専門とする研究室で行われている印象です。これは、1と3においてはその分野におけるドメイン知識が必要とされ、2ではどちらかというと機械学習の深い知識が必要とされるからであると考えています。1の新たなタスク設計は、2012年の深層学習の登場などの大きなゲームチェンジャーが現れた後に多くみられるのではないかと素人ながらに感じていました。「医療データに深層学習を適用して、このような新たなことができた」という論文はこれまで多く出されてきました。ただ、深層学習のトレンド開始から10年が経った今、そのような研究も以前よりは飽和状態にあり、単純に医療データに適用するだけでは研究としての新規性や面白さは見出しにくい状況にはなっているのではないかと思うようになりました(当時は当時なりの難しさがあったことは理解しています)。これからの時代は、2のようなドメイン知識よりは、より高度な機械学習知識を必要とする研究も行えるようになることで、1や3などの研究もより行いやすくなるのではないかと考えました。そのためには、機械学習を専門としている研究者の方々と積極的に関わっていかないといけないという結論にいたり、外部の研究機関に関わっていきたいと考えたきっかけとなりました。

そして、色々ネットサーフィンをして複数の候補を検討しました。その中でも論文サマリなどでよく拝見していたcvpaper.challengeが目にとまりました。中々メールを送ったりするのも勇気が要りましたが、無事にcvpaper.challengeに入れていただきました。

医療系学生のcvpaper.challengeとの関わり方

基本的には、特に専門が医療系だからといって他の方と、コミュニティへの参加方法が違うということはありません。ただ、最初はどのように接していけばいいのか、専門が機械学習ではないので差別を受けるのではないかなど不安でした。でも入ってみるととても暖かい方ばかりで、私の場合は特に中村さんに大変お世話になりました。入ってからすぐに、中村さんの研究に入れてもらい、どのように研究を進めていくのかを間近で体験することができました。そこからも現在に至るまでさまざまなアドバイスやサポートをいただき、大変感謝しています。毎週あるHacksという研究メンバー同士のグループミーティングにおいても、主宰の片岡さんや、山田さんをはじめとする博士課程の方々と議論することができます。基本的にはオンラインでの参加なのですが、長期休みの期間では産総研のさくら館というところに宿泊して、現地で活動をしていたこともあります。現地では片岡さんや産総研RAである中嶋さんや中村さん、山田さん、篠田さんがいました。また、偶然同時期に訪問していた高専3年の志田さんもいて、コロナの障壁はあったものの刺激的な日々を過ごせたと思います。

また、研究以外でも、先日のcvpaper.challenge conference winter2022(CCCW2022)の運営にも携わりました。Program Chairとして、コンテンツ決めや当日の進行などを行いました。至らない点も多くあったと思いますが、無事に終わることができてとてもよかったです。CCCW2022の事後アンケートでは、自分達で決めたコンテンツに対して好意的なコメントが多く寄せられており、大変嬉しく思いました。また、講演者の方々には非常にクオリティの高い発表をしていただき、感謝の念でいっぱいです。

機械学習非専門の学生がこれから機械学習を始めるには

これから機械学習を勉強していきたいという機械学習が専門でない学生も多いと思います。ここからお話しするのは、僕がこうすればもっとよかったなというポイントです。もちろんこれからお話しすることが正解とは限らないですが、少しでも参考になったらと思います。

まず、一つ目に後悔しているのは、最初の1年くらいを独学でやってしまっていたことです。独学でやると知識にバイアスがかかり、本当に重要なことを見落としてしまいがちです。機械学習を始めるにも、理論から勉強するか、実装から始めるかなどやり方はあるとは思いますが、どちらにせよ最初から一緒にできる人を探すべきだと思います。ただ、機械学習が専門でない学生は周りに同じような仲間も少なく、そのような環境に辿り着きにくいかもしれません。ですが、今は多くの学生コミュニティもありますし、SNSでそういった仲間を募集している人も多く見かけます。コロナ後はオンラインも急速に普及しているので、だいぶ仲間は探しやすいのではないでしょうか。積極的にそのような方々と関わっていくといいのかなと思いました。

二つ目は、理論の基礎を固めてから具体的な実装を身につけようとしたことです。今になって思うのは、いくら理論だけを勉強したところで、自分で実装して動かしてみないと何も理解できないということです。機械学習の能力は、データを見る能力とも直結しているなと感じていて、実際にデータを自分で触らないとわからないことが多かったです。そして、何も理解できていないまま勉強したものも、結局は忘れてしまいがちです。もちろん、機械学習の理論の研究をしたいという方は別ですが、最初から手を動かすことも大事だと思います。ある程度実装を通してデータの扱いに慣れてから理論を勉強する方が効率は良さそうな気がします。ここら辺も、周りに機械学習をやっている人がいないとなかなか体感としてわからない部分だったかなと思います。

一つ目の仲間を見つけることにおいても、二つ目の実装で手を動かしていくということにおいても、cvpaper.challengeはいい環境の一つだと言えると思います。cvpaper.challengeでは実装チュートリアルというものも定期的に開催されていたり、コミュニティ内の人に実装について質問すると答えてくれると思います。きっと機械学習に対して同じ思いを持った仲間も見つけやすいはずです!

おわりに

医療分野から研究するコンピュータビジョン領域について書かさせていただきました。僕を受け入れてくれたcvpaper.challengeの皆さんにはとても感謝しています。cvpaper.challengeではもちろん、思い通りにいかなかったり、悔しい思いもすることも少なくはないですが、その分得られるものも大きいと信じています。

学部生としての生活も残り2年ほどになってしまいましたが、これからも頑張っていきたいと思います!


この記事が気に入ったらサポートをしてみませんか?