知ってるつもりの主成分分析

知ってるつもりになってるものを他人に解説をするつもりで整理することで理解を深めるという、完全に独り善がりなチラ裏記事。
今回は主成分分析について自分の理解を整理する。間違ってるかもしれない。少なくとも正確ではないというか厳密ではないので、読むときには参考としてください。

1.主成分分析とは

主成分分析は多変量解析手法(データ分析手法)の1つで、機械学習の枠組みでは教師なし学習に分類されているも

もっとみる

#66 個人スタッツからチームの勝利貢献度を計るには?

遠藤保仁がいればチームの勝ち点は117%になる
データが見せるサッカーの新しい魅力

今日はこちらの本についてアウトプットしていきます。

以下目次になります。

〜目次〜
この本を読んだ背景
本の概要
気になったポイント
仕事への応用

この本を読んだ背景

「統計学が最強の学問である」を読み、統計学の万能さを理解しました。

「統計学が最強の学問である」についてのアウトプット記事はこちらから⬇

もっとみる
ありがとうざいます!投稿の励みになります!
13

主成分分析(PCA)の背景にある数学理論の話 - 最適化問題

今回は多変量解析の代表的なものである、主成分分析の話をします。とはいえ、主成分分析の目的やツールを使ったそのやり方に関しては非常に多くの書籍やWeb上の文献がありますので、ここではそういった話はせずに、主成分分析の背景にある数学的理論の話をメインとさせていただければと思います。
数学的な理論にフォーカスする意図として、共分散行列の固有値・固有ベクトルを求めることが、主成分分析の(アルゴリズムにおけ

もっとみる

[プロ野球データ分析] セ・パのトップ30のバッターを主成分分析したらうまく説明できそうな件

プロ野球のトップバッターはどんな性質を持っているか気になりません?

野球選手の良いバッター、悪いバッターの違いは何なのか。
ホームランが打てる人多いのかヒットが打てる人が多いのか。
トップバッターは野球で一般的な成績のどの部分の要素の性質を持っているのか気にならないでしょうか?
今回は、プロ野球のセ・リーグ、パ・リーグの上位30位のバッターを主成分分析して上位30位x2のバッターを分析しようと思

もっとみる

めっちゃわかる主成分分析③

書き途中。

イメージしやすいようにデータ少なめ。
身長と体重(2項目)。やる意味はない気がする。5項目以上ないと分析する価値がないから。雰囲気掴むにはいいかな。

項目3

もっとみる

めっちゃわかる主成分分析②

このページはデータ画像を置いてあります。
データが少ない方が理解しやすい人用。

標準化しない主成分分析

標準化する主成分分析

もっとみる
明日はあなたにとって良い日になるでしょう!
2

めっちゃわかる主成分分析①

色々勉強したけど結局どういうこと?って思った人へ
私の基礎知識は中学レベル位です。しかも5段階評価の3。

一言でいうと

データ全体の特徴を把握できる

二言でいうと

分析の効率化とデータの視覚化

三言でいうと

特徴を座標表面上に表せる

難しく言うと
多変量(多次元)有する相関関係を取り除くことで、
少数の次元に結合し視覚化や特徴の抽出を図る分析手法。
データの特異値分解を使用した低次元

もっとみる
あなたのスキがうれしくて。
3

Rを使った主成分分析

メタゲノム、トランスクリプトーム、メタボロームなどのオミックスデータのサンプル間の比較でよく用いられる主成分分析の方法。

まずは、準備として、"ggplot2" と "rgl" パッケージをインストール

> install.packages("ggplot2")> install.packages("rgl")

”meshr" もインストールしておきましょう。

> source("http

もっとみる

マーケティングリサーチで使われるコレスポンデンス分析について調べてみた

お仕事でコレスポンデンス分析を使ったアウトプットを提出する機会ができました。せっかくのチャンスと考えて「コレスポンデンス分析」について以前から悩んでいた点も含めて色々と調べてみました。

※アイキャッチに深い意味はないです。

あくまで、このnoteはその結果をまとめたものです。参考文献は都度記載しますが学術的な正しさを求められても困りますので、その前提でお読みください。

コレスポンデンス分析と

もっとみる
スキだけじゃ満足できないのでフォローもして下さい。
109

埋め込み層の描画

fastaiの表データを扱うtabularモデルは強力な予測手法だ.特にカテゴリーデータを埋め込み層で処理することが重要だが,結果をもとに洞察も得られる.

fast.aiの講義では協調フィルタリングの結果を主成分分析して2次元に落とし込んで可視化していたが,ここでは表データに対して適用してみる.

例として使用するのは以前紹介したadultデータだ.学習器のsummaryを見てみると先頭は埋め込

もっとみる