![見出し画像](https://assets.st-note.com/production/uploads/images/24968297/rectangle_large_type_2_5068534849ecbc63f344e597451be7f4.jpg?width=800)
【情報収集時の注意点】そのデータの誤差は何%?これを覚えるだけでOK
はじめに
おはようございます。医療介護データ研究所の まじめな所長 です。
毎朝30分でその時思ったことをコラムとして書いています。今日は「【情報収集時の注意点】そのデータの誤差は何%?これを覚えるだけでOK」というテーマで書きたいと思います。
テレビの視聴率の誤差
2020年は医療系のドラマが多かったですね。個人的にはアンサングシンデレラも楽しみにしていましたので、延期になってしまって少し残念でもありました。
2020年1~3月のドラマ視聴率ランキングをトップ3を調べてみると以下の通りでした。
2位と3位が医療系がテーマのドラマですね。
さて、ここで今回のテーマである誤差の話なのですが、ドラマの視聴率には何%の誤差があるかご存知でしょうか。
・・・
・・・
・・・
正解は約2%です。
なぜ、この誤差になるのかを簡単に解説します。
誤差はサンプル数と回答割合によって決まる
厳密にいうと他にも要素はあるのですが、ざっくりでいくとサンプル数と回答割合によって誤差が何%あるかが決まります。
サンプル数というのは、「アンケートを回答した人の数」です。視聴率の場合は、視聴率測定器を設置している世帯数ですね。
回答割合というのは、「○○と答えた人が何%いるのか」です。視聴率10%であれば、回答割合10%ということです。そのままですね。
視聴率は、関東だと900世帯、関西・名古屋だと600世帯、その他地域だと200世帯で調査されているそうです。(最近だと、変わっているという話もありますので、気になる方は調べてみてください。)
そして、視聴率はだいたい10%前後です。つまり、回答割合は10%程度です。
以上を踏まえて、視聴率の誤差をまとめると次の通りです。
関東地区だと2%、関西・名古屋地区だと2.4%、その他の地域だと4.2%の誤差が生じる可能性があります。
視聴率の誤差を見ると、1位のテセウスの船と3位のトップナイフの差がちょうど2%ですので、誤差の範囲で順位が変動してしまうことがわかりますね。
100サンプルで最大10%の誤差
視聴率に限らず、様々なアンケート調査に誤差はつきものですが、目安としては、「100サンプルで最大10%の誤差」ということを覚えておくと良いと思います。
覚えやすいですし、どの程度の差が開けば、統計上も有意な差と言えるのかの目安になります。
もう少し細かく理解したい方は、以下の「サンプリング誤差早見表」をご参考ください。
横軸がサンプル数です。100サンプルから3000サンプルまでのスケールで確認できます。
縦軸が回答割合です。回答割合は50%に近づくほど誤差が大きくなります。50%のように拮抗した回答割合であれば誤差が大きく、1%や99%のように偏った回答割合であれば誤差が小さいということです。
アンケートを取るときに「最低100サンプルは欲しい」ということがあるのは、最大誤差を10%以内に抑えたいというところからきています。
ただ、実際には100サンプルも取れずに使われている統計データもたくさんあります。そうしたデータに触れる際には、10%以上の誤差がある可能性があると理解しておけると良いと思います。
実は気を付けなければいけない非標本誤差とは
視聴率の例をもとに誤差の話をしてきましたが、実はこれ以外にも誤差には種類があります。
まとめると以下の通りです。
標本誤差というのが、ここまで話してきた統計上発生する誤差のことです。
統計の話をするとどうしてもテクニカルな標本誤差に目が行きがちですが、実は、非標本誤差のほうにも気を付けなければいけません。
非標本誤差というのは、人為的に発生する誤差のことです。
単純な回答ミスや集計ミスである「単純ミス」や、サンプルの性質によって発生する誤差である「サンプルの偏り」などです。
調査する人が気を付けるのはもちろんの事、情報を受け取る側も、以下のような疑問を持ちながらデータを見ると良いかと思います。
「誰に対して行ったアンケートなんだろう?(サンプルの偏りはないだろうか)」
「年収を聞くなど、回答者が答えにくい質問ではないだろうか?(回答の偏りはないだろうか)」
「主観によって回答にばらつきがでる質問ではないだろうか?(設問の偏りはないだろうか)」
おわりに
今日は、「【情報収集時の注意点】そのデータの誤差は何%?これを覚えるだけでOK」というテーマで書きました。
実生活においては、「100サンプルで最大10%の誤差」ということがわかっていれば、目安になると思います。
情報収集時の注意点については、他にも記事を書いていますので、よろしければ合わせてご参考ください。
【情報収集時の注意点】たった1つのことでグラフの悪意は見破れる
医療介護データ研究所のnoteとTwitterでは、「データを誰もが活用できる世の中にする」というコンセプトで、データに関する話、医療介護業界に関する話を発信しています。
応援してくださる方は、ぜひフォローいただけると嬉しいです。
それでは今日も良い1日を。
記事を読んでくださりありがとうございます。読んでいただけることが励みになります。もしサポートいただけましたら、研究活動に使わせていただきます。