統計学の勉強(おさらい1)

資産運用の一環として統計学を現在勉強しています。

現在読んでいる書籍は「完全独習 統計学入門」、補助として読んでるのは「マンガでわかる統計学」

「完全独習 統計学入門」の前半のまとめ。何度もノートに書いたりしてるけど難しいですねぇ。

統計学の基本と標準偏差、正規分布

生データだけだと数字の連なりだけで何がなんだかわからない

 ↓↓↓

縮約する

縮約とは
データとして並んでいる数字を何らかの基準で整理整頓して、意味のある情報だけを取り出すこと

縮約の種類

①グラフ化する(ヒストグラムを作る)
②1つの数字で特徴を代表させる(統計量を求める)
 統計量を求める例)
   a.平均値を求める
   b.散らばり具合の統計量を知る←こっちが重要

データの散らばり具合を理解する(分散)

平均:データの合計値÷データ数=μ(ミュー)
※「計算法にもとづいた名前」
偏差(deviation):平均値からどれくらい大きいか、あるいは小さいかの数値
μ(平均値)ーデータの値
平均からの離れ方
分散(variance):データのばらつき具合を評価できる
偏差を2乗したものの合計値÷データ数
※「計算法にもとづいた名前」
標準偏差(Standard Deviation):S.D. 偏差の二乗平均の量
二乗平均…平均したい数値を2乗して合計して個数で割り、そのあとルートにするもの
分散の平方根、σ(シグマ)
平均値から離れ方を平均化した値

S.D.で何がわかるか

前提
S.D.で測っていくつ分と表すことが重要、偏差や平均だけではデータを評価できない

{(データ)-(平均値)}÷(S.D.)という計算を基準に評価する

1.「1つのデータの中にある1つのデータの持つ意味」がわかる

S.D.±1個分なら月並みなデータ(約7割に入るデータだから)
S.D.±2個分以上離れてたらレアなデータ(両側合わせて5%しかない)

2.「複数のデータのセットを比較して出てくる違い」がわかる

各々のデータセットのS.D.によって同じ数値のデータでも評価が変わる

正規分布と標準正規分布

1.正規分布は最もよく見られる分布である

身長のデータやコイン投げなど

正規分布とは「集めたデータのばらつきが、平均値を境にして前後に同じくらいばらついてる状態)

2.標準正規分布は、平均値=0でS.D.=1である

標準正規分布は「ものさし」、頂点が0で変曲点が±1に調整されている

3.標準正規分布においては

平均からS.D.1個以内の範囲のデータは約70%弱
平均からS.D.2個以内の範囲のデータは約95%強

4.一般正規分布のデータ

変曲点は、頂点μ(平均値)から±σ(S.D.)の場所である

正規分布と標準正規分布はσ倍(1÷σ倍)の拡大縮小の関係

標準正規分布の性質

標準正規分布の性質その1

平均値=0
S.D.=1

標準正規分布の性質その2

(+1)~(-1)の範囲のデータの相対度数は0.6826
(+2)~(-2)の範囲のデータの相対度数は0.9544


こんかいはこれくらいです。今日区間推定のことろで躓いてます。








よろしければサポートをお願いします。サポート頂いた資金は勉強や研究費に充てさせていただきます。