G検定 / 統計検定 データの視覚表現 #7

株式会社リュディアです。引き続きデータの視覚表現、いわゆるインフォグラフィックについてまとめていきます。

過去の G検定 / 統計検定 データの視覚表現についてのまとめは以下を参照してください。

今回は散布図です。散布図は2つのデータの間の関係を見るときに使うグラフです。前回同様に大阪の COVID-19 に関するデータを使ってみます。例えばメディアの報道でよく言われる「PCR検査件数が少ないためPCR 陽性件数が少ないだけで、PCR検査件数をもっと増やす必要がある」という意見があります。一方で医療関係者の方は「むやみにPCR検査件数を増やしても仕方ない。自覚症状のある方、およびその周辺、いわゆる濃厚接触者の検査のみ行えばよい」と言われることが多いです。例えば以下の書籍を参考になさってください。

素人にはどちらの意見が正しいのかわからないですが、公開されているデータからPCR検査件数とPCR陽性件数の間に相関があるかどうかを調べることは可能です。ここで重要なことは調べることが可能なのは相関関係であるかもしれないということであって、因果関係があるかどうかは別なので注意してください。ではPCR検査件数と陽性件数の散布図を以下につけます。

画像1

この結果をご覧になられてどう思われますか?確かに横軸で 2,000 ~ 3,000 くらいまでは相関がありそうですが、それ以上はPCR 検査件数が多いとPCR 陽性人数も多いという感じでは無いような...

散布図は2つのデータの間に相関関係がありそうかどうかを判断するのに有効な表示形式だと思います。

実際の運用ではこのグラフに回帰結果を追加することでさらに有意な情報になりますがまた後程まとめます。

では、ごきげんよう。



この記事が気に入ったらサポートをしてみませんか?