見出し画像

画像処理のあれこれ3 クラス数の推定

はじめに

こんにちは。アダコテックの伊藤です。
先日、閾値自動選定法の多クラス問題への応用という記事を投稿しました。
対象画像に対して分類(多値化)すべきクラス数が既にわかっている事が前提となりますが、クラス数自身が未知であり、幾つのクラスに分類するのが適当であるかを判断したいケースが多々あると思います。

本記事では、対象画像に対して最適なクラス数を推定する手法について紹介します。

どうやるのか

画像の多値化は、濃度軸の 1 次元上のクラスタ分析と考える事ができます。
この問題は実質的には未解決の難しい問題の 1 つだと思いますが、閾値推定の指針となった分離度をもとに、最適クラス数をする方法を紹介します。(*1)

前回の記事では

画像4

を分離度としましたが、分離度の指標は

画像5

など色々な表現があります。(いずれもクラス間分散を最大化する問題に帰着しますが・・・。)
今回は1 次の統計量のみから計算できるηを分離度として最適クラス数の推定します。
なお、

画像6

となります。

クラス数がkの時に分離度をη(k)とした時、分離度が最大となるkの値を決定すれば良いのですが、kが増すにつれ k 値化の二乗誤差は常に単調に減少するので、η(k)はkに対する単調増加関数となり、

η(2) <η(2)<η(2)・・・<η(255)=1.0

のような傾向があるため、意味ある測度を得るには η(k)が持つこのようなバイアスを除去する必要があります。

参考文献では、このバイアスを除去するために輝度分布が一様である際の分離度η'(k)を利用し

画像7

の式で、最適クラス数の評価量を計算する事を提案しています。(評価量の最大値を求める)

計算してみる

下記画像を入力として2値化、3値化、4値化の多値化処理を実行し、最適クラス数を推定してみます。

画像1

画像処理結果は下記のようになります。

画像2

評価量の値は


Q(2)=-0.3994822040767847
Q(3)=-0.5005777330469574
Q(4)=-0.5440271993560395

となり、2値化が最適となるようです。
確かに2値した結果が明暗がはっきり分かれているような印象を受けますが、人によって印象が変わる気がします。

もうひとつ、3色で塗り絵した下記画像で評価してみます。

画像3

評価量は、下記のようになりました。


Q(2)=1.4570138440187554
Q(3)=1.4631559861428207
Q(4)=1.402433950615681

3値化した際がもっとも最適な結果で、実際の色数と一致しています。

おわりに

クラス数の推定方法について紹介しました。
参考文献にも記述されていますが、この問題は客観的評価も困難であるため心理実験も加え、今後さらに研究すべき課題だと思います。

参考文献

*1 大津展之 (2013)  『画像認識の基礎と応用 —  HLAC特徴を用いた学習型汎用認識』 トリケップス .

メンバー募集中です
アダコテックは上記のような画像処理技術を使って、大手メーカーの検査ラインを自動化するソフトウェアを開発している会社です。
機械学習や画像処理の内部ロジックに興味がある方、ご連絡下さい!
我々と一緒にモノづくりに革新を起こしましょう!
https://adacotech.co.jp/recruit

この記事が気に入ったらサポートをしてみませんか?