見出し画像

【第21回】 z検定とt検定 まとめ

ここまでの記事ではPythonを利用して母平均の検定(z検定・t検定)を行う方法をまとめてきました。
今回はこれまでの内容をまとめつつ、表計算ソフトを利用した方法について整理していきたいと思います。

表計算ソフトを使った方法もPythonを使った方法と同じように、多くの学びがあります。数学Iや情報Iの授業では、学習目標や生徒の習熟度に合わせてツールを選択し、仮説検定の考え方について学びを深められたらと強く感じているところです。

第18回 z検定

Point:母分散既知、大標本(大きさ30以上)

正規分布に従う母集団から、無作為に抽出した大きさが比較的大きな標本(30以上が1つの目安)から母平均$${ m }$$に関する仮説を検証するときに行う検定でした。
また、母分散$${ \sigma^2 }$$が過去のデータなどからおおよそ検討がついており、これを既知のものとするという仮定のもとで考えます。

この標本平均$${ \overline{X} }$$をもとに、母平均$${ m }$$に関する検定を行うというもので、次の例題を考えました。(片側検定の問題に改題)

例題1
2000年の小学校5年の全国の平均身長は148.5cm、分散は$${ 7.8^2 }$$であった。現代の小学校5年の児童を無作為に100名抽出したところ、その平均身長は150.0cmであった。小学校5年の児童の身長は伸びたと判断できるか。
有意水準5%で検定しなさい。ただし、児童の身長は正規分布に従うものとし、分散は2000年と変わらないものとする。

「統計学の図鑑」(涌井良幸・涌井貞美 著/技術評論社)p.82 例1を一部変更

現代の全国の小学校5年の児童全体を母集団としたときの母平均$${ m }$$が148.5より大きいという仮説を立てます。すなわち、帰無仮説と対立仮説は以下のようになります。

[帰無仮説] $${ m = 148.5 }$$  [対立仮説]  $${ m > 148.5 }$$

今回は、無作為に抽出された100名の児童の身長のデータが下の図のようにスプレッドシートの列Aにまとめられているとします。

図1: 例題1ー入力前

上の黄色のセルに関数を入れて求めていきます。(後ほど補足)

  • 標本平均(D5): =AVERAGE(A1:A100)

  • 不偏標準偏差(D6): =STDEV.S(A1:A100)

  • p値(片側確率): =Z.TEST(A1:A100,D1,D2)

  • p値(両側確率): =D10*2

これらの関数を入れて値を出力させますと次のようになります。

図1: 例題1ー入力後

従いまして、片側検定の場合はp値の約0.027が有意水準0.05より小さいため、帰無仮説が棄却されます。すなわち、「小学校5年の児童の身長は伸びたと判断できることになります。

以下、p値を求めた関数に関して補足です。Z.TEST関数は、

=Z.TEST(標本のデータ, 帰無仮説で仮定した母平均, 母標準偏差)

の形で利用します。ここで求めている確率には注意が必要です。
今回の場合は、

=Z.TEST(A1:A100, D1, D2)

を入力しましたが、これは母平均がD1の値(148.5)であるときに、標本平均がD2の値(150.0)より大きくなる確率(上側確率)を表しており、今回はこれがp値でした。

一方で、対立仮説によっては、標本平均がある値より小さくなる確率(下側確率)が求めるp値で、この関数をそのまま使ってしまうと、余事象の確率を求めてしまっていることになります。その場合は、

= 1 - Z.TEST(標本のデータ, 帰無仮説で仮定した母平均, 母標準偏差)

を利用してp値を求めることになります。

なお、この関数で母標準偏差を省略すると、標本の不偏分散の正の平方根をとって求めた標準偏差(不偏標準偏差)をもとに、上記のような確率を求めます。

第19回 1標本t検定

Point:母分散未知、小標本(大きさ30未満)

正規分布に従う母集団から、無作為に抽出した大きさが比較的小さな標本(30未満が1つの目安)から母平均$${ m }$$に関する仮説を検証するときに行う検定でした。
また、母分散$${ \sigma^2 }$$が未知であるという自然な状況での検定であり、よく使われる検定はこちらのほうです。

次の例題を考えました。(片側検定の問題に改題)

例題2
ある会社は、自社の作っている500mLのペットボトルの飲料に正しい容量が入っているかを調べるために、10本を無作為に抽出して測ったところ、次のような結果となった。
500.1, 501.4, 499.8, 499.5, 502.3, 503.0, 501.4, 500.6, 502.0, 499.9
この会社の出しているペットボトル飲料の容量の母平均は500.0mLより大きいと判断してよいか。有意水準5%で検定しなさい。

「統計学の図鑑」(涌井良幸・涌井貞美 著/技術評論社)p.98 例1を改題

この会社が作っている500mLペットボトル飲料全体を母集団としたときの母平均$${ m }$$が500.0より大きいという仮説を立てます。すなわち、帰無仮説と対立仮説は以下のようになります。

[帰無仮説] $${ m = 500.0 }$$  [対立仮説]  $${ m > 500.0 }$$

今回は、無作為に抽出された10本のペットボトル飲料の容量のデータが下の図のようにスプレッドシートの列Aにまとめられているとします。

図3: 例題2ー入力前

上の黄色のセルに関数を入れて求めていきます。次の2つの統計量については先程と同じです。

  • 標本平均(D5): =AVERAGE(A1:A100)

  • 不偏標準偏差(D6): =STDEV.S(A1:A100)

セルD10のp値(片側確率)ですが、これが少し難しいです。
表計算ソフトには、T.TEST関数という2標本t検定(第20回記事内容)におけるp値を求める関数があり、これを利用します。
結論を申しますと、下のようにB1:B10にすべて帰無仮説で仮定している母平均である500を入力し、元の標本データをこれと組にすると考えます。

図4: 例題2ーp値の前まで入力

その上で、セルD10に次のように入力します。

=T.TEST(A1:A10, B1:B10, 1, 1)

これにより、セルD10にはおよそ0.013が出力されます。
有意水準0.05より小さいことから帰無仮説は棄却されること、すなわち、この会社の出しているペットボトル飲料の容量の母平均は500.0mLより大きいと判断できることが分かります。

それでは、T.TEST関数について補足をしていきます。次の形が基本です。

=TTEST(範囲1, 範囲2, 尾部, 種類)

  • 範囲1, 範囲2:母平均の差についてt検定を行う2つの標本のデータ。(ただし、1標本t検定の場合は一方の範囲をすべて帰無仮説で仮定している母平均を入力し、組をなす2標本t検定を行う)

  • 尾部:片側検定の時は1、両側検定の時は2を入力

  • 種類 : t 検定の種類を指定します。

    • 1 の場合: 1標本t検定 or 組をなす2標本t検定

    • 2 の場合: 組をなさない等分散の2標本t検定

    • 3 の場合: 組をなさない非等分散の2標本t検定

今回は、1標本t検定で片側検定をしていたので下のように入力していたわけですね。

  • 範囲1:抽出した標本のデータ(A1:A10)

  • 範囲2:すべて500.0(B1:B10)

  • 尾部:片側検定なので1

  • 種類:1標本t検定なので1

第20回 2標本t検定

Point:2つの母集団の母平均の差の検定

正規分布に従う2つの母集団から、それぞれ無作為に抽出した標本のデータをもとに、母平均の差の検定を行うものでした。
これは2標本が組になっているデータか、組になっていないデータ(かつ母分散が等しいと仮定できない)の場合に分けて考えるのでした。

前回の例題で、それぞれ上のT.TEST関数をどのように使うかを確認してみましょう。

対応のある2標本

例題3
K先生は授業で担当をしている生徒に1年間、タイピング練習を行うような指導を行っている。K先生の授業を受けている10名の生徒を無作為に抽出し、1学期初めと3学期末のe-typingのスコアを比較したところ下の表のようになった。この結果から、タイピング練習の指導には効果があったと判断して良いだろうか。スコアの分布は正規分布に従うものとして、有意水準5%で検定をしなさい。

3学期末のスコアから1学期初めのスコアを引いた差の平均を$${ m }$$とします。今回は「効果があったかどうか」を判断したいので、片側検定になります。

[帰無仮説] $${ m = 0 }$$  [対立仮説] $${ m > 0 }$$

スプレットシートにまとめると次のようになります。
今回も、セルD10に次のように入力します。

=T.TEST(A1:A10, B1:B10, 1, 1)

図5: 例題3ー入力後

その結果、上のようにおよそ0.0247が出力されます。
これは有意水準0.05を下回っていますので、帰無仮説は棄却されます。すなわち、母平均の差はあり、タイピング練習の指導には効果があったと判断できることがわかります。

対応のない2標本

例題4
K先生は2020年度入学生と2021年度の入学生全員に対して、入学時のタイピング能力を図るため、e-typingのスコアを測定している。それぞれの年度の入学生10名を無作為に抽出し、そのスコアを調べたところ、次のような結果になった。
2020年度:123, 155, 177, 189, 195, 202, 209, 224, 254, 332
2021年度:151, 158, 190, 197, 199, 211, 235, 288, 300, 331
この結果から、2021年度入学生は2020年度入学生よりも入学時のe-typingのスコアの平均が高いと判断して良いだろうか。スコアの分布は正規分布に従うものとして、有意水準5%で検定をしなさい。

2020年度と2021年度の入学生全体の平均をそれぞれ$${ m_X, m_Y }$$とします。このとき、帰無仮説と対立仮説は次のようになります。

[帰無仮説] $${ m_X = m_Y }$$  [対立仮説] $${ m_X < m_Y }$$

スプレットシートにまとめると次のようになります。
今回は、セルD10に次のように入力します。

=T.TEST(A1:A10, B1:B10, 1, 3)

図6: 例題4ー入力後

その結果、上のようにおよそ0.2298が出力されます。
これは有意水準0.05を上回っていますので、帰無仮説は棄却されません「。すなわち、母平均の差はあると判断できず、2021年度入学生は2020年度入学生よりも入学時のe-typingのスコアの平均が高いと判断できないことが分かります。

まとめ

今回は、z検定・t検定について整理し、表計算ソフトを利用して検定を行う方法をまとめました。

私自身は、情報の授業の中でPythonで実習を行い、表計算ソフトを使った方法は手順や操作方法を示して各自演習を行うような課題としました。
仮説検定の考え方を理解するまでは苦労する生徒も多かったのですが、一度考え方を理解できれば操作自体はスムーズでした。
仮説検定の考え方のどのような部分が理解しにくいのか、指導のポイントなのかについては、また改めて記事を書いてみたいと思っています。

分析ツールの選択だけでなく、どこまでのことをどのように授業で扱っていくのか、数学の授業とどのように連携させていくのか、今後さらに研究を重ねて参りたいと思っています。

最後までお読みいただき、ありがとうございました。