見出し画像

データを見るときに考えていることは?

新型コロナウイルスの新規感染者がどんどん増えている。各都道府県ごとの新規感染者数を見て、マスメディアは多いとか少ないとかいうが、その根拠はどこにあるのか?

初期の頃は、前日と比較して増えたか減ったかといっていたが、平日と休日の違いによる増減があることが認識されるようになり、最近はようやく前週の同曜日と比較するようになった。

でも、私が知りたいのは、数を比較して多い少ないではなくて、人口に対して感染者の割合が高いところはどこなのかだ。

そこで、Excelを使って本日(2021年8月6日)のNHKが発表した都道府県別感染者数を人口比にしてみたのがこちら。

人口

感染者数の多い順に並んでいる。赤は、対人口比×10000(数をわかりやすくするために1万倍してある)が1以上、オレンジは、0.5以上だ。

こうしてみると、一番感染者数の多いのは東京だが、人口を考えると7位の沖縄がダントツで多いことがわかる。逆に9位の愛知は人口の割にはまだ少ない方だということがわかる。ここまでは、感覚的にも予想がついた。

では、神奈川や千葉・埼玉の感染者数はどうか。東京より人口が少ないから感染者数も少ないというのは見ればわかるが、対人口比は同程度ではなく、上位と比べてそれぞれ割合が少なくなっていることがわかる。

人口2

そして、下位の方をみてみると、感染者数が少なく見える鳥取が人口の割には多いことがわかる。

自分が住んでいる都道府県の人口くらいは知っているから、人口に対して感染者数が多いか少ないかは感覚的にわかるのかもしれない。しかし、他の地域に関しては、なんとなく、だいたいしか知らない人が多いのではないだろうか。ましてや、世界に至っては、計算してみないと正確なところはわからない。

少しだけ手間をかけて、対人口比を出すだけで、いろいろな情報がわかる。情報をそのままではなくて、持っている知識を利用して受け取っているのだろうが、感覚的にでは間違っていることもあるだろう。

最近人気のデータサイエンスでも勉強してみようかと思った。


この記事が気に入ったらサポートをしてみませんか?