見出し画像

予測モデル構築における特徴抽出やデータ前処理の重要性

今回のコラムでは、モデル構築における特徴抽出、あるいはデータ前処理の重要性について解説させていただこうと思います。

例として、ある製鉄所で、金属表面にある傷を目視で良品/不良品の判定を行なう工程があり、今後の量産化を見込んで、判定処理を検査員に代って自動化することを検討しているとしましょう。

その実現方式として、ニューラルネットワークを活用することにします。当然、目視に代る入力データとして考えられるのが、金属表面の画像データで、出力として検査員の判別結果を与えて学習します。

画像データの入力方法として思いつく最も安易な方法は、画素ごとに入力ニューロンを割り当てることですが・・・

これはもっとも多く見受けられるやってはいけない失敗パターンです!なぜダメかという理由は以下の通りです:

傷検査の判定基準は、例えば傷の幅、長さ、深さ、色などの形状の特徴であって、傷が1画素分ずれたり、傷の方向の角度が異なっていてもその評価は変わらない(恒常性を持つ)ことになります。

そして、画素データそのまま入力の何が問題かというと、それはニューラルネットワークに与えることの出来るデータ(パターン)は、事実上収集が制限される一方で、判定基準の前提としている平行移動や回転に対する対称性(判定の不変性)をニューラルネットワークが獲得するには、大量の少しずつ異なったパターンのデータを学習する必要があり、現実問題として十分なデータをそろえることが困難な点です。

仮にもしデータが大量に収集できたとしても、今度はその大量データの学習時間は途方もないものとなることでしょう。

以上のことは、金属表面の傷判別に特化した話ではなく、あらゆる問題に対して、特徴抽出(データ前処理)を行なわずにモデル構築を行なった場合に起き得る問題です。

ニューラルネットワークの適用に当たって、系の対称性の考慮や情報量の集約、熟練者の視点を入力変数へ盛り込むこと等は、非効率な学習の負担を削減(局所解に陥るリスクも削減)し、またデータ収集・モデル検証のコストを削減させ、最短で汎化性を持つモデルに到達する為の重要なポイントなのです。

弊社では、データ分析プロジェクトにまつわる様々なご相談に、過去20年以上に渡るプロジェクト経験に基づき、ご支援しています。

社内セミナーの企画等、お気軽にご相談いただければ幸いです。

この記事が気に入ったらサポートをしてみませんか?