見出し画像

データ全体の世界地図を作る~自己組織化マップ入門

これまでのコラムでは、「教師付き学習」の話を主にして参りました。

すなわち、外部からネットワークに対して望ましい出力(教師信号)を与えて、ネットワークに同じ出力を返すように学習させるもので、パーセプトロンやバックプロパゲーションが知られています。

一方、明示的な教師信号を用いない「教師なし学習」と呼ばれるものがあります。

代表的なものとして、自己組織化マップ(Self-Organizing Map, SOM)があります[1][2]。

SOMは、フィンランドのヘルシンキ大学コホーネン教授により1981年頃に発表されたニューラルネットワークで[3],大脳皮質(特に視覚野の自己組織化)をモデルにしたニューラルネットの一つです。

その特徴は、N次元のレコード群を、レコード間の類似度を保ちながら、低次元へ情報を集約することが出来る点です。

例えば、顧客情報データベースで定義されている顧客属性(年齢、性別、職業、家族構成、等々)がN項目あったとしましょう。

この場合、各属性(変数)をN次元空間のそれぞれ独立な軸に対応させた場合、各レコードはその空間の1点となります。また、レコード間の”類似度”とは、その2点間の”距離”に対応することが分かります。

企業のマーケティング担当者は、優良顧客を見分けるために、顧客属性の類似度でグルーピングしたいわけですが、難しいのは、それがN次元であるため、直感的に把握できないことによります。

そこで、SOMの適用によるデータの集約(低次元化。例えば2次元)により、データ間の類似性を直接"見る"ことができるようになります。SOMによる応用や適用時の注意点について、次回のコラムでもう一歩踏み込んでみたいと思います。

[1] ニューラルワークスPredictでは、トップメニュー画面の
    「データのクラスタ性の発見と解析」
    を選択し、ウィザードに従って構築します。
[2] Professional II/PLUSでは、InstaNetの「Self Organizing Map」を選択します。
[3] 参考文献としては、
     Teuvo Kohonen 著,徳高 平蔵,大薮 又茂,堀尾 恵一,藤村 喜久郎,
     大北 正昭監修:'自己組織化マップ',シュプリンガー・ジャパン,2005年6月。

弊社では、データ分析プロジェクトにまつわる様々なご相談に、過去20年以上に渡るプロジェクト経験に基づき、ご支援しています。

社内セミナーの企画等、お気軽にご相談いただければ幸いです。

この記事が気に入ったらサポートをしてみませんか?