超過死亡の判断の仕方教えて下さいなメモ

ネット上で「超過死亡が明らかに起こってる!死者はもっと多い!」って騒いでいる人が多いけれど、その根拠の手法ってホントなの?というメモ。誰か教えて下さい。
追記:超過死亡についてのスタンスは「ないわけがない」「でも人数はそこまで大きくないのでは?というか有無では無く桁数が論点…」というものです

なお、東京都以外の検証をしようとしたら、月次で死亡者数出してない県ばかりのようで、対応断念してます。そんな市町村単位だったらもっとブレが多くて判断できないだろうにさ…
追記:50日待てば厚労省の速報がでるらしい。ぼちぼち3月分。2019年分も含めて、それを使えば2020年3月までの47都道府県単位のデータはだせそう。

当方が用意したデータ

人口動態調査の「中巻_2_死亡数、都道府県・死亡月・性別」の23年間(1995-2018年)のcsvファイルを連結して加工し、東京都の2019年1月~2020年3月までの速報を手で追加してExcelファイルにしたもの

疑問① 過去の死者数は補正を加えなくてよいのでは

ネット上で「超過死亡あるよ」派な人は高齢化の状況を加味して過去の数字を読み替えた上で8年分のデータで処理をしている

しかし、論文を読むと、過去の死亡者数は補正せず、適切な手法で期待値を出して比較している。そりゃそうだ、平均寿命が延びている中では、同じ年齢でも死にやすさは変わっているから、同じ年代を「高齢者」と定義しちゃう方がミスリードだと思う。

疑問② 月ごとの死亡者数は単純な回帰直線を引けばよい?

前述の論文では、以下のような手法があると整理されている

・月数と三角関数sin, cosを用いた回帰直線モデル x2
・季節ARIMAモデル
・年間死亡率と季節指数を用いたモデル x2
・確率的フロンティア推定モデル

月数とか季節指数とか三角関数を使ってるのって、要は◯月は多い・◯月は少ないという傾向があるということだから、◯月だけの推移比較を見るときは、単純な回帰直線モデルでよいように思います。
と思ったら同意見のひと見つけた

前述の人は「回帰直線じゃないでしょ」とかいているが…

疑問③ 超過死亡あるよ派は3年間か8年間の数字使ってるのチェリーピッキングじゃね?

2012年あたりから引っ張ると傾きが低くて「超過だよ」と言いやすい説

疑問点踏まえて自分なりに作って見たデータ

単純な線形近似と比べた死者数の差は1-3月合計で+117人。3月だけ切り出しても+143人。2%未満の増加。

1月 +650 (線形近似12047、実績12697)
2月 -676 (線形近似10391、実績9715)
3月 +143 (線形近似10551、実績10694)
4月 ?? (線形近似9739、実績不明…)



この記事が気に入ったらサポートをしてみませんか?