見出し画像

【第26回】仮説検定の理解の壁 -授業実践から-

本記事は2021年度の高校1年生の情報の授業において、情報Iの「データの活用」と数学Iの「仮説検定の考え方」の内容を一部取り入れて授業を行った実践のご報告になります。

至らぬ点も多々ありましたが、実際に授業をしたことで得られたことが多くありました。

高校生が仮説検定のどういうところに躓きやすいのか、どのような所が指導上の留意点だったのを振り返りつつ、ポジティブな気持ちで次年度に向けた課題を整理していく記事にしたいと思います。

授業実施内容

次のような8コマ(50分 × 8)の授業を実施しました。

  1. データの活用の意義、尺度水準、母集団と標本

  2. モデル化とシミュレーション

  3. 仮説検定の考え方(二項分布、母比率の検定)

  4. 母平均の検定(正規分布とt分布、t検定)

  5. クロス集計、アンケート調査(実習)

  6. カイ2乗検定、アンケート集計と分析(実習)

  7. 分析結果のまとめ(発表スライドづくり)

  8. 発表と振り返り

本記事では、3回目の「仮説検定の考え方」における実践をもとに、今後に向けた反省をして参りたいと思います。

具体的な問題

本記事の話を分かりやすくするために具体的な例でお伝えいたします。

[例題]
あるコインを10回投げたとき、表が8回出た。このコインは表の方が出やすいような歪みがあると判断できるか。有意水準5%で検定しなさい。

この[例題]は次のように解答します。

このコインを1回投げて表が出る確率を$${ p }$$としたときに、$${ p>\frac{1}{2} }$$であることを主張したいので、帰無仮説と対立仮説は次のようになります。

[帰無仮説] $${ p = \frac{1}{2} }$$ 
[対立仮説] 
$${ p > \frac{1}{2} }$$

帰無仮説のもと、このコインを投げて10回中8回以上表が出る確率は、次のコードを実行して求められます。

from scipy import stats
stats.binom_test(8,10,0.5,alternative = "greater")

これを実行すると、p値はおよそ0.0547であることが分かります。
これは有意水準の0.05より大きいので、帰無仮説は棄却されません。
すなわち、このコインは表が出やすいような歪みがあるとは判断できないというのが結論です。

理解の壁

本記事では、下記の主な躓きのポイント2つについてまとめます。
実際に生徒から受けた質問の形で書いてみたいと思います。

  1. 帰無仮説が棄却されないってことは「歪みがないと判断できた」ってことですね?

  2. p値が有意水準より小さい場合も、たまたま珍しいことが起きただけなのかもしれないのに、それをもとに「歪みがある」と判断してしまって本当にいいの?

いずれも仮説検定の考え方にとって本質的なところですので、ここをきちんと理解してもらうところが勝負です。
それでは、順に見ていきましょう。

帰無仮説が棄却されないことの意味

帰無仮説を棄却されないことを「帰無仮説が正しいと判断できる」という誤解をしてしまう生徒は少なくありません。

仮説検定において意味があるのは「帰無仮説を棄却することで対立仮説が正しいと判断すること」であり、帰無仮説を棄却できない以上は何も判断ができないことをしっかりと押さえてもらいたいところです。
仮説検定が「帰無仮説と対立仮説の2つの仮説のうち、どちらが正しいのかを検証するものではない」という大前提をおさえないと、このような誤解からなかなか抜け出せません。

生徒がこのような誤解をしてしまう原因となっていると後から感じた自分の発言から検証してみましょう。

仮説検定は背理法と似ています。背理法では証明したいことの否定を仮定することで、矛盾が生じることから元の命題が正しいことを証明していましたね。帰無仮説はその命題の否定と近い考え方です。

「kenstyの発言」より

これが、どうして誤解の原因になるのか。
背理法の定番「$${ \sqrt{2} }$$が無理数であることの証明」で見てみます。

$${ \sqrt{2} }$$が有理数であると仮定すると、
(中略)
これは$${ m }$$と$${ n }$$が互いに素であることに矛盾する。
よって、$${ \sqrt{2} }$$が無理数である。

背理法では「$${ \sqrt{2} }$$が有理数である」ことを仮定すると矛盾が生じることから直ちに「$${ \sqrt{2} }$$が無理数である」が従うような論理の流れです。これは排中律(二重否定は肯定)を前提にしています。

一方で、仮説検定はそれとは異なります。
帰無仮説は「棄却される」か「棄却されないか」であり、真か偽かではないわけです。
帰無仮説の棄却を「命題が偽」のイメージで捉えてしまうと、

帰無仮説が棄却できない → 偽でない → 真である → 帰無仮説は正しい

というイメージにつながってしまい、「帰無仮説が正しいことが示された」という誤解につながるのだと思います。

それでは、どのようにすれば誤解が少なくなるのかですが、やはり何らかの例えを使って説明するのが良さそうです。
定番ではありますが、「裁判における有罪判決」あたりが分かりやすいのでしょうか。おおよそ次のような説明がよくなされます。

  • K被告が有罪であると判断するときは、K被告が無実であることを十分に否定できる事実があるときです。

  • この「K被告が無実である」が帰無仮説にあたります。

  • 無実かどうか怪しいが無実であることを否定できるような決定的な証拠がないと、K被告は有罪にはなりません。

  • つまり、帰無仮説が棄却できないときは有罪であるとは判断できない証拠不十分な状況であり、無実であることの証明ではないということです。

私は自分自身が仮説検定を学んだときに、この最後の「証拠不十分」という言葉がしっくりきたのを覚えています。
帰無仮説を棄却できるだけの十分な情報がそろってない、だから対立仮説が正しいとは判断できないというのは自然な考え方です。

例えば、試行回数の8割の回数で表が出る状況でも、10回中8回表が出るのと、100回中80回表が出るでは、後者の方がより珍しい状況が起きていると直観的に捉えられます。
実際にこのときのp値を下記コードを実行して求めてみます。

stats.binom_test(80,100,0.5,alternative = "greater")

今度は、およぞ0.000000000558で明らかに有意水準0.05より小さくなります。同じ標本比率(80%)であっても、標本が大きい方が帰無仮説を否定するのに十分な「証拠」が集められているというようなイメージです。

帰無仮説が棄却されることの意味

今度はp値が有意水準を下回ったことで、対立仮説が正しいと判断して良いのか、たまたま珍しいことが起きただけ(たまたま偏った標本だっただけ)とは考えられないのかという生徒からの質問です。

まず、この質問の回答のポイントを箇条書きでまとめてみましょう。

  • 確かにたまたま珍しいことが起きただけの可能性もある。

  • ただ、帰無仮説の仮定のもと、それが起こってしまう確率は5%未満という非常に低い確率である。

  • 実際にコインが歪んでいるかどうかなんて、コインを投げただけでは真実は分からず、ここではあくまで推測をしていることに注意したい。

  • その推測を「人間の感覚」に頼らず、「確率」に基づいているのが統計的仮説検定である。

  • 推測なので誤ることがあるが、その誤った判断をしてしまう確率を5%までは許容して判断しましょうということ。

  • 判断方法として、「p値が0.05を下回ったら、帰無仮説を棄却しましょう」という事前の取り決めをしているのが有意水準5%の意味である。

  • 誤った判断を防ぐためには有意水準を1%などに下げればよいのかもしれないが、それだと本当に歪んでいるときに歪みがあるという判断もしにくくなってしまうので、適切に有意水準を決めておく必要がある。

この上記のものが説明のほとんどすべてで、これをかみ砕きながら丁寧に説明をして考えてもらうのですが、それでも納得しにくいようです。
それはなぜでしょうか。

おそらくですが、「確率に基づいた統計的な推測」に不慣れであることが一つの要因となっているのかと思われます。
私は仮説検定を行ったときの結論として、「コインは歪んでいると判断できる」と表現するのですが、ここを「コインは歪んでいる」と断定的な言い方に頭の中で変換してしまっているのかもしれません。
数学の授業でこれまで行ってきた「証明」では、「したがって、~が成り立つ」のように確実に言える主張で締めくくります。
この慣れ親しんでいる思考により、ここでもコインが歪んでいることが絶対確実なこととして証明されたような感覚になのかと見て取れました。

これも何らかの例えが必要なのかと思いました。緊急地震速報や火災報知器などは、誤って地震や火事である判断をしてしまうという「誤報」がつきものですが、それをある程度許容して、実際に起きたときにきちんと知らせてくれるものを私たちが求めているようなものでしょうか。

数学Bで仮説検定を扱うときには、その前に「区間推定」を学習しており、統計的な推測にある程度、慣れ始めている状態なので、もう少し理解しやすくなっているのかもしれません。

まとめ

確率分布を未習の高校1年生に数学Iや情報Iで「仮説検定の考え方」を教えるのは、いろいろと注意しなければならないことがあると感じました。

教員が適切な例示正確な言葉遣いを行うとともに、生徒自身が仮説検定の一連のプロセスを繰り返し経験し、思考の過程を言葉で表現することが本当に大事だということがよく分かります。
その試行錯誤の過程において、p値の算出やヒストグラムの描画が容易にできる表計算ソフトやPythonの良さを活かしていきたいと改めて感じたところです。

何が生徒にとって、理解の「」になっているのか、今年度の実践をもとに、2022年度も引き続き研究を重ねて参ります。

本記事の感想、ご助言などいただけましたら大変励みになります。
今後もどうぞよろしくお願いいたします。

最後までお読みいただき、ありがとうございました。