見出し画像

【高校情報Ⅰ参考書共通テスト対策】区間推定・カイ二乗検定(χ2乗検定)・クロス集計・95%信頼区間/教科書完全準拠 統計学

区間推定・χ2乗検定(カイ二乗検定)・クロス集計・95%信頼区間


【資料ダウンロード】

PDFの他、パワーポイント、学習指導案 等の原本も無料提供しています。

情報教育の底上げが目的なので、資料を修正して、学校・塾(営利目的含む)の授業等で利用して頂いて問題ありません。私への連絡不要ですが、利用する際には、YouTubeチャンネル・情報Ⅰ動画教科書・IT用語動画辞典を紹介してもらえると嬉しいです。

■PowerPoint資料
https://toppakou.com/info1/download/28ADVANCE区間推定とクロス集計/28ADVANCE区間推定とクロス集計.pptx

■Excel資料
https://toppakou.com/info1/download/28ADVANCE区間推定とクロス集計/28ADVANCE区間推定とクロス集計.xlsx

■簡易学習指導案
https://toppakou.com/info1/download/28ADVANCE区間推定とクロス集計/【学習指導案】28ADVANCE区間推定とクロス集計.docx



【文字おこし】

今回は、区間推定、クロス集計、χ(かい)二乗検定について説明していきます。
事前知識として、以前動画解説した母集団と標本とZ検定、t検定についての知識が必要になります。


知識習得が未だの方は概要欄に貼ってあるURLから先に確認頂けると幸いです。

以前、母集団と標本の説明の中で 10万個のどらやきの母集団の中から、100個のどら焼きを無作為に抽出する話をしました。

無作為に抽出しても、母平均と標本平均には誤差が発生する可能性があります。
また、1回目の抽出は平均101g 2回目は99gと言ったように標本内でも取得するたびに差が出る可能性があります。

標本をもとにして調査し確率的に母集団がどのような値を持っているかを推測することを、推定と言います。
テキスト的な表現だと、「標本における一定の法則を母集団に当てはめて推し量る」ことを推定といいます。
推定には、母平均μ=100と言ったように1点で表す 点推定や
95≦μ≦105 と言ったように推定値に一定の幅を持たせる区間推定があります。

今回は区間推定について掘り下げて説明していきます。

先ほど、標本平均にも誤差が発生すると話しましたが、何度も母集団から抽出しその平均値の発生頻度を調べると標本平均も正規分布となります。

区間推定では、この正規分布の95%に属する範囲は高い確率で信頼できるとして、その範囲を95%信頼区間と言います。

Z値になおすと、両端2.5%の位置は1.96でそれを基準に内側に属する区間になります。

具体的な数式で説明します。
母分散が分かっている場合と分かっていない場合で分かれます。

画像1

数式だけだと分かりずらいと思うので具体的な数値を当てはめながら練習問題を解いて行きましょう。
――
★練習問題
母集団の母分散は25.0ということが分かっている。
この母集団から100個を標本として無作為に抽出したところ、標本平均は8.60であった。
母平均μの95%信頼区間を求めてください。

★パワポ参照

画像2

つぎはクロス集計とΧ(かい)2乗検定について説明していきます。

とある高校の1年生と2年生を対象に、学校の校則変更に賛成か反対かのアンケートを取った結果です。
この高校では1年生が220人 2年生が180人です。
1年生で賛成は175人 反対は45人
2年生で賛成は125人 反対は55人 でした。

賛成の合計は300人 反対の合計は100人になります。
  1年生と2年生の合計人数は400人になります。

この表をクロス表と言い、このような集計作業をクロス集計と言います。

この結果から 1年生と2年生の回答に有意な差があるといえるかを調べる仮説検定方法にカイ2乗検定があります。χの記号はエックスのように見えますが、χ かい と読みます。パソコンで かい と入力しても候補として出てきます。

仮説検定なので帰無仮説と立証したい対立仮説が必要になります。

帰無仮説は、1年生と2年生で有意な差は無い
対立仮説は 1年生と2年生で有意な差がある とします。

χ二乗検定を行う上で期待度数という知識が必要になってきます。

期待度数は、アンケート結果の合計が分かっている状態で、全体の割合から考えて期待される数になります。

たとえば1年生で賛成の人の期待度数は 賛成の合計300×1年生の合計人数220÷全体人数の400 を計算すると165になります。
1年生で反対の人の期待度数は 反対の合計100×1年生の合計人数220÷全体人数の400 を計算すると55になります。
2年生も同様に計算すると135と45になります。

χ2乗検定のχ2乗値は (実測度数―期待度数) の2乗 ÷ 期待度数 の値を合計になります。

この式からわかることは・・
• 期待度数と観測度数が完全に一致すれば、χ2乗値はゼロになる
• 逆に、不一致(ずれ)が大きくなれば、χ2乗値は大きな値になる

期待度数に実測度数がどの程度一致しているか調べる検定を適合度検定と言い
 χ二乗検定も適合度検定の1つになります。

1年生の賛成のセルについては (175―165)の2乗 ÷ 165の式で計算すると、小数第5位を四捨五入して0.6060 となります。

他のセルも同様に計算していき 値を合計したχ2乗値は 5.3869となります。


ここで求めたχ2乗値が今までのt値やZ値に相当するものと思ってください。
有意水準5%のχ2乗分布表はこちらになります。

ここの自由度について説明していきます。
自由度は自由に決められるあたいの数ことで
たとえばこのクロス集計表で合計が既に決まっている状態の表の場合、1つのセルに値を入れると他のセルの値はきまります。
左上に200をいれると その右側は合計の220―200で20となります。
下がわは300―200で100となります。そのとなりは180―100で80となります。
なので自由に決められる値は1つだけで自由度は1になります。
セルの数が増えるほど自由度は増えますが
(行数―1)×(列数―1) で簡単に求めることができます。
今回は行数は2 列数も2 なので 計算すると1になり 先ほど説明した数と一致しました。

今回は自由度1なのでχ二乗分布表では限界値は3.841となります。
今回求めたχ2乗値の5.3869は限界値を上回っているので、帰無仮説を棄却し、1年生と2年生で有意な差があるということになります。

――
今話した計算はエクセルを使って簡単に実施することが可能です
まず右上の期待度数は賛成の合計×1年生の合計/全体合計 で各セルを指定します。
オートフィルを使ってコピーできるようにドルマークを付けて絶対参照にしていきましょう。
賛成の合計は、行は固定なので行の前にドルマークを付けます。
F4キーを何度か押してドルマークの位置を変更できます。
学年の合計は列は固定なので、列の前にドルマークを付けます。
全体合計は列も行も固定なので、すべてにドルマークを付けます。
オートフィルを使ってコピーすると期待度数がすべて埋められました。

次にp値を求めていきます。
この結果になる確率になります。これはCHITEST(カイテスト)関数を使います。
第一引数に実測度数を範囲指定します。
第二引数に期待度数を範囲指定します。
P値が算出されました。約2%の確率で起こる結果になります。
次にχ2乗値を求めます。これはCHIINV(カイ・インバース)関数を使います。
第一引数に先ほど求めたp値、第二引数に自由度をしていすると、χ2乗値が算出されます。

今日の区間推定、クロス集計、χ2乗検定の説明は以上になります。
最後までご視聴ありがとうございました。

【解説重要用語】

区間推定、95%信頼区間、クロス集計、クロス表、χ二乗検定(カイにじょうけんてい)、期待度数、実測度数、χ二乗値、適合度検定、χ二乗分布表、χ二乗検定の自由度、

★私の目標
「とある男が授業をしてみた」 の葉一さん
https://www.youtube.com/user/toaruotokohaichi
※Google社に招待頂いた、「YouTube教育クリエイターサミット2020」で
 葉一さんと文部科学省・Google役員の対談セッションに感銘を受けて、高校情報講座スタートしています。

【参考サイト・参考文献】
数学嫌いのための社会統計学〔第2版〕
https://www.amazon.co.jp/s?k=%E7%B5%B1%E8%A8%88%E5%AD%A6+%E6%95%B0%E5%AD%A6%E5%AB%8C%E3%81%84&ref=nb_sb_noss
※佛教大学 情報科教員養成 基礎統計学のテキスト

予備校のノリで学ぶ「大学の数学・物理」 - YouTube
https://www.youtube.com/channel/UCqmWJJolqAgjIdLqK3zD1QQ

文部科学省 「情報Ⅰ」教員研修用教材
https://www.mext.go.jp/a_menu/shotou/zyouhou/detail/1416756.htm

詳細(情I703 高校情報I Python)|情報|高等学校 教科書・副教材|実教出版 (jikkyo.co.jp) 検定通過版
https://www.jikkyo.co.jp/book/detail/22023322

令和4年度新版教科書「情報Ⅰ」|高等学校 情報|日本文教出版 (nichibun-g.co.jp)検定通過版
https://www.nichibun-g.co.jp/textbooks/joho/2022_joho01_1/textbook/

#区間推定 #高校情報 #統計学


この記事が気に入ったらサポートをしてみませんか?