見出し画像

Excelで標準偏差 (stdev stdev.p stdev.s)

エクセルでの標準偏差の求め方を説明します.

標準の関数を使えば簡単に求まりますが,stdev, stdev.p, stdev.s など複数あります.

■ 要点

1.よく分からない人は stdev() 関数を使うのがおそらく一番安全.
2.stdev.p() と stdev.s() だけを覚えておけば問題ない.
   (stdev() は stdev.p() と同じ)
3.統計学上の「標準偏差」は stdev.p() であり stdev.s() ではない

■ stdev.p() と stdev.s() の使い分け

場合分けをします.
・計算に使うデータが,全データであるなら stdev.p() を使う
・計算に使うデータが,全データの一部に過ぎないなら stdev.s() を使う

前者の例:
全受験者のテストの点数の情報を持っていて,その標準偏差を求めるなら
stdev.p() を使います.
これこそが,統計学上の「標準偏差」であり,
これは推定ではない.

後者の例:
全日本人の身長の標準偏差を求めたいが,全データは持っていない.
全日本人から無作為に抽出した(サンプリングした)10000人分のデータを使って「全日本人の身長の標準偏差」を推定したい.
この場合は,stdev.s()を使います.

■ 結局,標準偏差はどれか?

(前述の通り)統計学上の「標準偏差」は,stdev.p() です.

■ stdev.pの値 と stdev.sの値 の関係は

画像5

ただし,nはサンプル数

となります.

まとめると以下の様になります

画像4

ただし,(*1) の「不偏標準偏差」とうい呼称は「誤りである」との主張もあります.世界的に呼称が混乱しています.
正確に呼びたいなら「不偏分散の平方根」と呼んでください.

分散は,こちら↓ これは非常に有名.

分散式

標準偏差はこちら↓ これも非常に有名

標準偏差式


不偏分散はこちら↓ これが有名でない?これが難しさの原因

不偏分散式

不偏標準偏差はこちら↓

不偏標準偏差式

4者の関係は以下の通り

4個の関係

■ よくわからない人は stdev() を使えば良いのか?

前述の様に、stdev() は stdev.s() と同じで、厳密には「標準偏差」ではありません。
でも、単に stdev という名前の関数を使うと,stdev.s() になってしまいます。
「標準偏差を求めてください」と依頼を受けたときに stdev() を使ったら、間違っているとも言えます。

正しいのは「全データを持っておらず、全データの一部をサンプリングして、そのサンプリングデータを用いて 全データの標準偏差を予測する」ときは、stdev.s() つまり stdev() を使います。
勝手な予想ですが、Microsoftの方は これが当てはまることが多いと予想して「stdev は stdev.p と同じ」にしたのではないですかね。

勘違いしてはならないのは、「全データの標準偏差の予測」ではなく「一部のサンプリングデータの標準偏差を計算」したいときはやはり stdev.p() を使うべきです。

■ Excelでの入力

A1からA10の10セルに入っている値の標準偏差を計算したければ,下図のように =STDEV(A1:A10) を入力すれば良いので非常に簡単です.
stdev() と stdev.s() が同じであることも確認できます.

画像8


この記事が気に入ったらサポートをしてみませんか?