統計検定2級取得のための基礎復習〜Day1~
なぜこの記事を書いているか
わからなかった単語
標準化とは
平均が0、分散が1となるようにデータを変形させることで異なる平均値・分散を持つデータ同士を比較できるようにすること。
目的変数とは
要因を受けて発生している結果に関する変数
(心理学では)=従属変数
説明変数とは
要因となっている変数
(心理学では)=独立変数
相対度数とは
それぞれの階級における度数/度数の合計
階級の幅の決め方
スタージェスの公式
$$ 階級の数 = 1+log_2n $$
ローレンツ曲線
所得分配の不平等や人口集中の程度などを視覚的に捉えるグラフ
ジニ係数
ローレンツ曲線と完全平等線の間の面積
下の図のように、台形面積の考え方を用いて求める
中央値、平均値、最頻値(モード)の関係
分布の偏りなどがわかる
中央値の使い方
ちょうど真ん中ぐらいの人の年収がわかる、とか
幾何平均
年間で平均何%ぐらい値上げしたか、などを求める際の平均
歪度(わいど)
歪度だけなぜこの定義になるかわからない・・・
外れ値検出のある箱ひげ図
箱ひげ図には外れ値検出機能がある
標準偏差
分散のままでは単位が2乗されていて、平均などと足し引きすることはできないため、標準偏差が用いられる
変動係数
牛肉と卵など、元々の値段が異なるものの標準偏差をそのまま比較することはできないため、標準偏差を平均値で割ることで相対的なばらつきを見ることができるようにする。
この記事が気に入ったらサポートをしてみませんか?