見出し画像

1つの母平均に関する検定・推定(母分散未知)【超詳細解説】

実際の問題を解きながら解説します。

例題
ある加工機で生産される部品の真円度は母平均$${21.1{\mu}m}$$で安定している。ある日、加工機の主軸を交換したので、精度確認のため$${n=10}$$のデータを取ってみると次のようになった。母平均は変化したと言えるか、有意水準5%で検定しなさい。
$${20.1,21.3,19.7,20.0,20.4,20.0,19.2,21.0,22.4,19.4}$$
(ばらつきは主軸の交換前後で変化しないものとします)

母分散既知の問題との大きな違いは、その名の通り母分散が分かっているか、分かってないか、です。
この問題は、母平均は問題で与えられて言いますが、母分散は与えられていませんから、「母分散未知」の問題です。

母平均が変化したかどうかを知りたいので、先ずは10個のデータの平均値を求めましょう。

$$
\begin{array}{rcl}
平均値\ \={x}&=&\cfrac{20.1+21.3+19.7+20.0+20.4+20.0+19.2+21.0+22.4+19.4}{10}\\\\
&=&20.35
\end{array}
$$

ここで一旦仮説の設定をします。
主軸変更前の母平均を$${\mu_0\ (=21.1)}$$、主軸変更後の母平均を$${\mu}$$とします。

帰無仮説 $${H_0:\mu=\mu_0}$$
対立仮説 $${H_1:\mu\ne\mu_0}$$

さて、問題は母分散です。母分散が分からなければ問題は解きようがありません。
しかし、今回は貴重な$${n=10}$$のデータがあります。
ばらつき(分散)は主軸の変更前後で変化しませんから、得られた$${n=10}$$のデータから分散を計算して、母分散の代わりに使っちゃおうぜ!ってことです。
では分散を計算しましょう。

まず、偏差平方和を求めます。各々のデータと平均値19.35との差を求めて、差の2乗の合計を求めてもいいんですが、計算が多くてスーパーメンドクサイ。
こんなときは公式を使うと便利です。

$$
偏差平方和\ S=\sum{{x_i}^2}-\cfrac{(\sum{x_i})^2}{n}
$$

で求められます。
なんじゃこりゃ・・・・と思うかもしれませんが、これは覚えちゃった方が早いです。これで計算すると偏差平方和がすぐ計算できちゃう便利ツールだと思ってください。
やってみましょう。
$${\sum{{x_i}^2}}$$は各々のデータをすべて二乗して、それを合計しなさいって意味ですね。

$$
\begin{array}{rcl}
\sum{{x_i}^2}&=&(20.1)^2+(21.3)^2+(19.7)^2+(20.0)^2+(20.4)^2+(20.0)^2+(19.2)^2+(21.0)^2+(22.4)^2+(19.4)^2\\\\
&=&4149.71
\end{array}
$$

$${(\sum{x_i})^2}$$は全てのデータの合計を二乗するって意味です。

$$
\begin{array}{rcl}
(\sum{{x_i})^2}&=&(20.1+21.3+19.7+20.0+20.4+20.0+19.2+21.0+22.4+19.4)^2\\\\
&=&(203.5)^2\\\\
&=&41412.25
\end{array}
$$

よって、

$$
\begin{array}{rcl}
S&=&\sum{{x_i}^2}-\cfrac{(\sum{x_i})^2}{n}\\\\
&=&{4149.71-\cfrac{41412.25}{10}}\\\\
&=&4149.71-4141.225\\\\&=&8.485
\end{array}
$$

と求められました。
分散$${V}$$は偏差平方和$${S}$$を$${n-1}$$で割ればOKです。

$$
\begin{array}{rcl}
V&=&{\cfrac{S}{n-1}}\\\\
&=&{\cfrac{8.485}{10-1}}\\\\
&=&0.943
\end{array}
$$

これで
「このデータから考えると、母分散は恐らく$${0.943}$$だろう」
と推定できたわけです。
この推定した分散を不偏分散と呼びます。覚えておきましょう。

ではここで一旦グラフにしてみます。

ここで分散は$${\cfrac{V}{n}}$$になっていることに注意してください。
上で求めたのは、母分散の推定値である不偏分散$${V}$$です。
今回考えるのは母集団から$${n=10}$$取ったときの平均値ですから、平均値の分散は$${\cfrac{V}{n}}$$になります。
1個とった平均は、平均$${\mu_0}$$、分散$${V}$$に従い、
10個とった平均は、平均$${\mu_0}$$、分散$${\cfrac{V}{n}}$$に従うのでしたね。

さて、ここから標準化して20.35が棄却域に入るのか入らないのか計算したいところですが、母分散未知の問題は重要ポイントがあります。

母分散未知の場合、サンプルから勝手に分散を求めて母分散の代わりに使っちゃってますから、標準正規分布表を使えないんです。
代わりにt分布表を使います。
(何で標準正規分布を使えないのかは今は気にしなくてもいいです。
「分散を勝手に計算して母分散の代わりに使ったらt分布に従う」
と覚えてください。)

一旦、母分散既知の場合と同じ標準化の計算をしてみます。
母分散既知の場合は$${u_0}$$としましたが、今回はt表を使いますので、$${t_0}$$としましょう。

$$
\begin{array}{rcl}
t_0&=&\cfrac{\={x}-\mu_0}{\sqrt{\cfrac{V}{n}}}\\\\
&=&{\cfrac{20.35-21.1}{\sqrt{\cfrac{0.943}{10}}}}\\\\
&=&-2.443
\end{array}
$$

ここで、t分布表を見てみます。

自由度$${\phi}$$は$${n-1}$$で求めることができます。今回は$${\phi=9}$$ですね。両側確率$${P}$$は今回は、そのまま有意水準5%を使いましょう。よって、$${P=0.05}$$です。
交点を読むと、$${2.262}$$です。これが$${t}$$値になります。
$${t}$$表右上のグラフを見てください。つまり、$${-2.262}$$以下と、$${2.262}$$以上が棄却域ってことですね。

グラフにしてみましょう。

先ほど求めた$${t_0}$$は$${-2.443}$$でした。$${-2.262}$$より小さくなったので、棄却域に落ちたことになりますね。これを式で書くと、

$$
\mid{t}\mid=2.443> t(9,0.05)=2.262
$$

と書きます。絶対値で書いてあるところがポイントですね。
$${t(9,0.05)}$$は自由度$${9}$$、有意水準$${0.05}$$の$${t}$$値ですよって意味です。
$${t}$$分布を使った判定のときは、こういう表記をすることが多いです。

「以上より、有意である。すなわち有意水準5%で真円度が変わったと言える。」

が答えとなります。

以上、母分散未知の母平均の検定でした。

ポイントは
・サンプルから母分散の推定値である、不偏分散を求めて使うこと
・不偏分散を使った場合は、標準正規分布ではなく$${t}$$分布に従うこと

です。
逆に言えば違いはこれだけですから、2つのポイントだけ押さえればバッチリ解けますね。

よかったら、スキ・フォローもお願いします!コメントも是非!
他にも解説記事を書いています。ご覧ください!

この記事が気に入ったらサポートをしてみませんか?