【Day44_主成分分析】独学3ヶ月でデータサイエンティストにどこまで近づけるかチャレンジ

どうも、totaです。Day44となりました。今回は主成分分析についてです。

引き続き『Rによる統計的学習入門』にて学んでいます。

こちらの「第10章:教師なし学習」のなかの主成分分析のところを読み進めました。

さて、主成分分析についてですが、これは簡単にいうと「データをいかに要約するか」という分析です。

例えばある百貨店のお客さま購買データ(そのお客さまが何を購入したかのデータ)があった

もっとみる
マジでありがとうございます!!!!
4

【Day40_機械学習_次元削減】独学3ヶ月でデータサイエンティストにどこまで近づけるかチャレンジ

どうも、totaです。Day40の報告です。今回は「次元削減」についてです。

学習コンテンツは引き続き『Rによる統計的学習入門』になります。

こちらの「第6章:線形モデル選択と正則化」における「次元削減」および「高次元の場合に考慮すべき事項」について学びました。

さて、次元削減とは何かというと「単純化」です。

機械学習ではたくさんのデータから予測モデルを構築します。

その際にたくさんある

もっとみる
マジでありがとうございます!!!!
2

知ってるつもりの主成分分析

知ってるつもりになってるものを他人に解説をするつもりで整理することで理解を深めるという、完全に独り善がりなチラ裏記事。
今回は主成分分析について自分の理解を整理する。間違ってるかもしれない。少なくとも正確ではないというか厳密ではないので、読むときには参考としてください。

1.主成分分析とは

主成分分析は多変量解析手法(データ分析手法)の1つで、機械学習の枠組みでは教師なし学習に分類されているも

もっとみる

#66 個人スタッツからチームの勝利貢献度を計るには?

遠藤保仁がいればチームの勝ち点は117%になる
データが見せるサッカーの新しい魅力

今日はこちらの本についてアウトプットしていきます。

以下目次になります。

〜目次〜
この本を読んだ背景
本の概要
気になったポイント
仕事への応用

この本を読んだ背景

「統計学が最強の学問である」を読み、統計学の万能さを理解しました。

「統計学が最強の学問である」についてのアウトプット記事はこちらから⬇

もっとみる
ありがとうざいます!投稿の励みになります!
13

主成分分析(PCA)の背景にある数学理論の話 - 最適化問題

今回は多変量解析の代表的なものである、主成分分析の話をします。とはいえ、主成分分析の目的やツールを使ったそのやり方に関しては非常に多くの書籍やWeb上の文献がありますので、ここではそういった話はせずに、主成分分析の背景にある数学的理論の話をメインとさせていただければと思います。
数学的な理論にフォーカスする意図として、共分散行列の固有値・固有ベクトルを求めることが、主成分分析の(アルゴリズムにおけ

もっとみる

[プロ野球データ分析] セ・パのトップ30のバッターを主成分分析したらうまく説明できそうな件

プロ野球のトップバッターはどんな性質を持っているか気になりません?

野球選手の良いバッター、悪いバッターの違いは何なのか。
ホームランが打てる人多いのかヒットが打てる人が多いのか。
トップバッターは野球で一般的な成績のどの部分の要素の性質を持っているのか気にならないでしょうか?
今回は、プロ野球のセ・リーグ、パ・リーグの上位30位のバッターを主成分分析して上位30位x2のバッターを分析しようと思

もっとみる
うれしいです^^

めっちゃわかる主成分分析③

書き途中。

イメージしやすいようにデータ少なめ。
身長と体重(2項目)。やる意味はない気がする。5項目以上ないと分析する価値がないから。雰囲気掴むにはいいかな。

項目3

もっとみる
また来てね(^○^)
4

めっちゃわかる主成分分析②

このページはデータ画像を置いてあります。
データが少ない方が理解しやすい人用。

標準化しない主成分分析

標準化する主成分分析

もっとみる
明日はあなたにとって良い日になるでしょう!
2

めっちゃわかる主成分分析①

色々勉強したけど結局どういうこと?って思った人へ
私の基礎知識は中学レベル位です。しかも5段階評価の3。

一言でいうと

データ全体の特徴を把握できる

二言でいうと

分析の効率化とデータの視覚化

三言でいうと

特徴を座標表面上に表せる

難しく言うと
多変量(多次元)有する相関関係を取り除くことで、
少数の次元に結合し視覚化や特徴の抽出を図る分析手法。
データの特異値分解を使用した低次元

もっとみる
あなたのスキがうれしくて。
3

Rを使った主成分分析

メタゲノム、トランスクリプトーム、メタボロームなどのオミックスデータのサンプル間の比較でよく用いられる主成分分析の方法。

まずは、準備として、"ggplot2" と "rgl" パッケージをインストール

> install.packages("ggplot2")> install.packages("rgl")

”meshr" もインストールしておきましょう。

> source("http

もっとみる