『Pythonデータ解析入門』 第9章 主成分分析
本章では主成分分析の基礎について学びます.主成分分析は,データの高次元な特徴空間を低次元の特徴空間に変換する次元削減の手法の1つです.主成分分析によりデータがその特徴空間において持つ情報を要約するような新たな特徴を見つけることができ,データの圧縮やデータの可視化に応用することができます.
まず,主成分分析による次元削減の基本的な考え方について学びます.次に,2次元のデータの直線上での表現を例にして,分散を最大化するという主成分分析の基本的な考え方について学びます.最後に,主成分分析による任意の次元のデータの次元削減の手法について学び,その手続きが行列の固有値問題に帰着することを学びます.
プログラミング演習では,主成分分析による次元削減の手法をプログラムとして実装します.その上で,実際のデータとして自由時間でのスポーツ活動に関する都道府県別のデータをもとに,主成分分析を用いてそれらのスポーツ活動を特徴づける新たな特徴の抽出とデータの可視化を行います.
本章の学習を通して,主成分分析の基本的な考え方について理解し,実データに対して主成分分析による次元削減の手法を実際に適用することができるようになることを目標とします.
9.1 主成分分析による次元削減
9.2 主成分分析の考え方
9.3 主成分分析の詳細
9.4 プログラミング
この記事が気に入ったらサポートをしてみませんか?