見出し画像

統計検定準1級ワークブック例題 第22章

統計検定準1級ワークブック(以下WB)の「第22章 主成分分析」の例題について書いていきます。

解答例はいろんな動画や記事で紹介されていると思うので、ここでは思考のプロセスというか考え方のヒントを書いていきます。本記事が同資格を受験する方のお役に立てば幸甚です。


例1

主成分分析を行う前の、前処理の問題です。この問題がそのまま本試験に出るとは思いませんが、標本分散共分散行列と標本相関行列を求めることで、何をやっているのか理解していきましょう。

計算自体はそんなに複雑ではなく期待値、分散、共分散を地道に計算していく必要があります。観測値から標本共分散を求めるときはn-1で割る必要があります。(忘れがち)

項目が4つあるのですが全部計算するのは面倒なので、私は毎回2つだけ解いてました。

例2

問1からの続きの問題です。既に標本分散共分散行列(または標本相関行列)から固有値と固有ベクトルが計算されていて、問題で与えられています。

時間があれば1度自分で計算してもいいかもしれません。「固有方程式」が分からないと解けないので、別動画で理解を深めてながらがおススメです。

(1)は主成分分析の目的が抑えられていればOKで、(2)も主成分負荷量の意味が理解できていればOKです。

問22.1

この章には例題は1つしかありません。主成分分析を行うにあたって必要な情報は問題で与えられているので、その情報を使っていかに結果を分析できるかが問われています。

主成分分析の目的や各用語の意味の理解が必要です。キーワードは「主成分」「固有値」「固有ベクトル」「寄与率」「累積寄与率」「主成分負荷量」の6つです。

流れを理解するのがポイントですね。
①観測値から標本分散共分散行列(標本相関行列)を求める
②標本分散共分散行列から固有値、固有ベクトルを求める
③寄与率、累積寄与率を求める
④主成分を求める
⑤主成分負荷量を求める
⑥図を書く(変量プロット、主成分得点プロット)

以下補足です。固有値問題の計算自体は手計算だと結構時間がかかり、全体の試験時間や問題数のバランス等を考えると、本試験に出る確率は低いのではと思います。(出たらすみません…)

とはいえ、固有値問題を解くことで、何をやっているのか、分散の最大化とは、直交行列とは、等の理解が深まり、結果的に主成分分析の問題が解けるようになるのではと思います。

解法メモ

解法メモはご自身で納得のいくように作成されることをおススメします。参考までに私が作成した解法メモを貼っておきますが、間違っている可能性もありますので、あくまでもご参考までということでお願いします。

22-1


22-2

おまけ

例と例題を解くだけならそんなに難易度は高くないと思いますが、主成分分析を理解するためには足りないような気がします。別動画等でWB本文の理解を補強したいところです。

なお、以下の記事で勉強方法や参考にした書籍、動画、記事などを書いています。ご参考まで。

#統計検定
#統計検定準1級

この記事が気に入ったらサポートをしてみませんか?