定義を変えないこと

様々なデータを扱う時に注意すべきことはいろいろありますが、誰でも意識すべきは、データ(数値)を集める際の定義だと思います。例えば複数の面ディア(NHK、朝日、毎日、読売など)がそれぞれ内閣支持率の調査を行い発表していますが、各社の値にはかなりの隔たりがあります。これはどのように理解すれば良いのでしょうか。毎日新聞が解説した記事がありますので紹介してみます。

画像3

調査の項目が異なれば、結果が違うという説明:

あらゆる調査と同様、世論調査にも一定の限界があります。よく話題になる内閣支持率も調査方法や選択肢と離れて数字だけを見るべきではありません。たとえば、実施する報道機関が違えば選択肢や聞き方が異なるため、単純に数字だけで比較することはできません。
 毎日新聞が定例で実施している全国電話世論調査では内閣支持率の選択肢は「支持する」「支持しない」「関心がない」の三つです。10月26、27日に実施した結果では「支持する」が48%、「支持しない」が30%、「関心がない」が19%でした。
 朝日新聞の世論調査は「支持する」「支持しない」の二択です。11月16、17日実施の結果では「支持する」44%、「支持しない」36%で、その他・答えないが20%でした。
 聞き方が異なれば、答えが違うのは当然です。この結果からだけでは「毎日のほうが朝日より内閣支持率が高い」とか「10月末から11月中旬にかけて内閣支持率が下がった」などと言えないことは明らかです。

「変化が重要」という説明もあります。各社の数字は違っていても、それぞれが継続して調査することの理由は、変化を知ることだ、と理解すれば良いと思います。

各社の世論調査結果を折れ線グラフにして表示すると数字は異なっても、支持率が上がる、下がるという推移はおおむね近い形になります。

つまり「変化が重要」で、その変化を知るには、同じ定義で継続して調査することが前提になります。


という視点を意識した後、この記事はどう見えるでしょうか。

画像1

ほんの一例ですが、データを集める際の定義を変えると、読み取れることも読み取れなくなってしまいます。

集計方法を変更しなければならない、でもデータを大事にしたいなら、例えばしばらくは変更前と変更予定のデータを両方集計するなどが必要です。それをしないのは、データを大事にしていない、という証拠になると思います。


こちらはデータを大事にしている例です。定義(観測場所)をやむをえず変更した場合の補正方法が説明されています。

画像2

データの継続性をとても重視していることが良くわかると思います。

データを集める側がデータを大事にしているか。
今回はこの視点で考えてみました。