深層学習を用いた偏りのあるデータに対して頑健な学習手法に関する研究
2023年度研究会推薦博士論文速報
[コンピュータビジョンとイメージメディア研究会]
加藤 聡太
((株)センスタイムジャパン リサーチャー)
【背景】実世界のデータには多くの場合偏りが含まれる
【問題】データの偏りによって予測精度が大幅に下がる傾向にある
【貢献】さまざまな偏りに対して頑健な,深層学習の新たな学習手法を提案した
近年,画像内に写っている物体を理解する画像認識の分野では,AI(Deep Learning)を用いた方法が高い精度を出すことが知られており,AIモデルのため大量の画像データを学習に利用する機会が増えている.しかし,実世界の環境で収集されたデータには,さまざまな実環境によって発生する「偏り」が含まれる場合がほとんどである.
たとえば,1枚の画像をあるクラスに分ける画像分類の場合,実世界の環境で収集された画像データは,それぞれのクラスのデータ数が同じではなく,あるクラスに属するデータが多くを占め,残りのクラスのデータが割合的に見てほとんど存在しないといった状態になりがちである.クラス間のデータ数が一定であれば,各クラスの精度のばらつきは微量であるが,クラス間のデータ数の割合が不均衡なデータセットを用いた場合,データが多いクラスに学習が影響を受け,データが少ないクラスの精度が極端に低くなる問題が発生する.
通常の学習方法では,データ数の不均衡を無視し,各クラスで不均一な学習が発生する可能性があった.これは正しいクラスの予測確率のみを最大化する学習しか行わないことが原因であり,間違えたクラスの予測確率を最小化する学習を直接行う必要があった.そこで提案する学習手法では,各クラスのデータ数の情報を基に,予測確率を最小化するクラスを適応的に決定し,予測確率を最小化する学習を行う.これにより,通常の学習よりもバランスの取れた学習が可能であり,5つの評価実験結果ではすべてにおいて高精度を達成した.
また画像分類よりも高度な認識課題である,セマンティックセグメンテーションでは,画像の1 画素単位でクラスの予測を行う.しかし,検出したい領域の面積と背景領域の面積比が極端に大きく異なる場合,背景領域の学習にモデルが支配されることが考えられる.特に CT 画像やMRI 画像が代表される,医用画像から腫瘍など異常領域を検出したい場合,セマンティックセグメンテーションの技術が使われる場合が多いが,検出したい腫瘍などの異常領域は非常に小さいため,モデルが誤認識を起こす原因となる.
通常の学習では,予測領域と正解領域の差はある類似度関数を用いて計算するが,提案手法ではより厳しい類似度関数を採用した.これにより,領域が大きく識別が簡単なクラスには,より幅が狭い厳しい類似度を適用し,領域が小さく識別が難しいクラスには,より幅が広い優しい類似度を適用することが可能となり,最終的にクラスごとに最適な類似度を使用した適応的な学習が可能となった.4つのデータセットを用いた評価実験では,通常の類似度関数を用いた時よりも高い精度を達成し,2つのデータセットで最高精度を達成した.
本研究は画像認識において発生するさまざまな偏りに対して頑健な,新しい学習手法を提案したものであり,これにより深層学習の実世界応用がより加速すると考えられる.
(2024年6月1日受付)
(2024年8月15日note公開)
ー ー ー ー ー ー ー ー ー ー ー ー ー ー ー ー ー ー
取得年月:2024年3月
学位種別:博士(工学)
大学:名城大学
ー ー ー ー ー ー ー ー ー ー ー ー ー ー ー ー ー ー
研究生活 始めは何となく楽しいという理由だけで博士課程に進みましたが,博士課程の3年間で学んだことは非常に大きく,いまとなっては進学してよかったなと思います.研究の進め方や論文の書き方もですが,特に自分の研究を分かりやすく伝える能力が格段に向上しました.これはさまざまな場面で役立つものだと思います.
研究生活はとにかく自分が面白いと思ったことをやっていました.あまり成果を気にしていなかったように思います.しかし研究は自分の頑張った結果が論文という形で世の中に知れ渡るのものであり,世界の研究者に自分の論文を読んでもらい,興味を持ってもらえたときの喜びは素晴らしいものです. 研究の道に進んでくれる人が増えてくれると嬉しいです.