No.068 統計学のお勉強 1標本 母比率の検定
1.今回の目的
統計検定2級の勉強をしていますが、文系出身の私にはかなり難しいです。
過去問をパターン化して、取れる問題を確実にゲットしたいといことで、今回は母比率の検定について2018年-2021年6月の過去問をまとめてみました。
統計検定2級公式問題集2018-2022年(日本統計学会編)を参考にpythonで問題を解いてみます。
この過去問集では、2018年6月、2018年11月、2019年6月、 2019年11月、2021年6月と計5回の検定試験の問題が網羅されています。
調べてみたところ、1標本の母比率の検定は毎回1問出題されています。
著作権の関係もあるので、問題の概要はさらっとまとめますが、以下のような問題です。
2021年6月_問17(1): 500回の画びょう投げ→284回表 95%信頼区間は?
2019年11月_問13: 100人に出口調査 Aに投票は54人 95%信頼区間は?
2019年6月_問14: 300匹の魚に目印してリリース後、再度池から魚を200匹捕獲すると20匹に目印がついていた。95%信頼区間は?
2018年11月_問12: アンケート回答者1338人中 ほぼ毎日利用する人の割合は2.0%. 95%信頼区間は?
2018年6月_問11(1): 総務省の調査によると、北海道の野球の行動者率は7.1%, 標本サイズは4663人。 95%信頼区間は?
この問題において、計算の前提として必要なのは、標本比率と信頼区間と標本サイズです。それを下記の式に当てはめます。なお、過去5回ともに95%区間で問題が出ていますので、思い切ってz=1.96という値を暗記してしまうのも良いと思います。
あとは、√(標本比率 x (1-標本比率) / 標本サイズ)をかけて、標本比率からの±すれば算出されます。pythonで一気にといて、後は自力で計算もできるように練習します。
import numpy as np
import pandas as pd
from IPython.display import display
from IPython.display import Math
df=pd.DataFrame({'問題':['2021年6月_問17(1)','2019年11月_問13','2019年6月_問14','2018年11月_問12','2018年6月_問11(1)'],
'標本比率':[284/500,54/100,20/200,0.02,0.071],
'信頼区間':[0.95,0.95,0.95,0.95,0.95],
'標本サイズ': [500,100, 200,1338,4633]})
df
df['z値']=stats.norm.ppf(loc = 0, scale = 1, q = (1-df['信頼区間'])/2)*-1
df['範囲']='標本比率±'+(np.round(df['z値'] * np.sqrt(df['標本比率']*(1-df['標本比率'])/df['標本サイズ']),3)).astype(str)
df['下限'] = df['標本比率'] - df['z値'] * np.sqrt(df['標本比率']*(1-df['標本比率'])/df['標本サイズ'])
df['上限'] = df['標本比率'] + df['z値'] * np.sqrt(df['標本比率']*(1-df['標本比率'])/df['標本サイズ'])
display('pを求める公式は(正規分布近似):',Math(r'{z=\frac{\hat{p}-p}{\sqrt{p(1-p)/n}}}~N(n-1)'))
display('pの信頼区間は:',Math(r'\hat{p}-z\times\frac{\sqrt{\hat{p}(1-\hat{p})}}{\sqrt{n}}<=p<=\hat{p}+z\times\frac{\sqrt{\hat{p}(1-\hat{p})}}{\sqrt{n}}'))
df
以上です。
この記事が気に入ったらサポートをしてみませんか?