2022/10までの人口動態統計速報値をグラフ化

2022年10月までの人口動態統計速報が出ました。今回はその数値と過去の速報値から、2022年の値が如何に異常なのかをビジュアル化してみました。

まず、平成16年(2004年)から2022年10月までの実数のグラフです。

人口動態統計速報から

このデータを分析していきます。

下のグラフは、上のデータのうち、2004年から最新の10月分のデータを使っています。青い点(2004~2021年まで)と赤丸(2022年)が散布図です。赤い点線は回帰直線、緑の2本の線は、95%信頼区間を示しています。
赤丸(2022年10月)が、2本の緑の線から大きく外れています。これは、めったに起きないこと、起きる確率が95%以下と言えます。

さらに、99%信頼区間(緑)と、回帰直線の信頼区間(紫)を細い線で書き込んだグラフです。

2022年10月は、99%信頼区間からも大きく外れていることがわかります。値としては、6σ以上離れていました。50万分の1位の確率です。

12カ月分全部についてグラフを作成しました。(11月、12月はデータが未発表なので、赤丸がありません。)

最初のグラフで直感的に死者数が異常に多いと感じる、2月、3月、8月、9月、10月が、はやり95%信頼区間から外れていることがわかります。1月から10月までσの何倍かけ離れているかの数値です。
-0.288、2.900、3.396、1.570、1.600、1.726、2.110、7.783、5.964、6.845
(1.96より大きいと95%信頼区間から外れていることになります)

もう1つグラフを作りました。

実際の死者数から回帰直線で得られた数値を引いたグラフです。2011年3~6月頃までのの死亡者数が特に多かったこと(東日本大震災の年)、2月、3月に時々多い年がある(恐らくインフルエンザの影響)が見られます。コロナの初年2020年は、死者数が少なかった。2021年3月頃から増加した。そして2022年が異様に多いことが、ここでも読み取れました。

いろいろな仮説はあるとは思いますが、今回も、データのグラフ化だけで終わります。