シェア
最近、会社のデータの関係性を分析しようと思っていて、相関、因果などを調べているのですが、その中で勉強したこと、考えたこと、学んだことを一回まとめてみたいと思います。 相関とはまずは、一番の基礎となる相関からスタート。相関とはなにか。英語の方が考えやすいと感じているのですが、英語では、correlation(統計の関数などではcor とかcorrみたいな関数になることが多いですよね)。きっと co-relationなんです。つまり、お互いに関係している状態ということです。
統計検定2級の試験を受けてきました。 テストが終わり、改めて勉強してきたノートとかを見直していたのですが、この試験で出る範囲は、データ分析者にとっては基礎的な部分のカバーする範囲ではあるのですが(だからこそ、落ちると恥ずかしいと思っています。たぶん大丈夫なはずなんですが。。。) むしろ、データ分析者と一緒に仕事をする人、データの活用を促進したい人こそ受けるべき知識を習得できる構成になっていることに気づきました。 今回はその理由について説明していきたいと思います。 は
内場先生の授業2回目 今回のメインテーマは、相関係数と共分散 Corr(X,Y):XとYの相関係数 = Cov(X,Y):XとYの共分散 / (Xの標準偏差・Yの標準偏差) という公式が昨日のメインでした。 また、Cov(X,Y) は分解の公式がいろいろあるということでごにょごにょ計算に使うのに便利。 だけど一言で説明するのは難しいとのこと 一方、相関係数はイメージしやすいが、応用的に使うのはなかなか難しいという話。 これを一発で解決するのが、標準化だ