ラビットチャレンジ_機械学習4

・主成分分析(PCA)

 ・教師なし学習の1つで、次元削減を行う際に使用する。
 ・分散が最大になるように次元削減をする
  ⇒分散が最大 = データの情報が一番残っている
 ・目的関数に制約条件(ノルムが1になるものs以下考えない)を付加した
  ラグランジュ関数を微分して分散が最大になる点を見つける
 ・寄与率:第k主成分の分散の全分散に対する割合
 ・累積寄与率:第1-k主成分まで八淑した際の情報損失量の割合
 
 演習:乳がん検査データを利用しロジスティック回帰モデルを作成
    主成分を利用し2次元空間上に次元圧縮
 課題:32次元のデータを2次元上に次元圧縮した際に、
    うまく判別できるか確認する
 
 説明変数30個でロジスティック回帰モデルを用いて分類した結果
 ⇒97.2%で分類できている

画像1

 2次元に圧縮した結果
 ⇒分類できている
  メリット:分類できていることを図で確認できるため説明に説得力がでる

画像2


この記事が気に入ったらサポートをしてみませんか?