見出し画像

コロナ感染・定点観測まとめ(1)

 そろそろコロナ感染のまとめと思い、表題になりました。コロナウイルスの寿命も然りですが、己の寿命も考えるこの頃です。急がねば、AK数式が宝の持ち腐れになるかもしれず、それは避けたいのです。
 今日は、以下の項について述べます。
 Ⅰ:定点観測下のコロナ感染概況
 Ⅱ:定点数×定点患者数=平均患者数の数式
 Ⅲ:患者数の人口数比化の数式 

Ⅰ:定点観測下のコロナ感染概況

 初めに
 定点観測は、感染状況を手早く正確に知ることを目標に、厚労省が採用した感染状況分析手法です。当シリーズも、定点観測は初めての経験でしたがその意図は理解し、実用面での効果も期待していました。 
 2024/2/19~2024/2/25の都道府県ホームページによる”患者数”を得て、定点観測なるものを具体的に知る絶好の機会と思いました。その後、幸いにしてAK数式による定点数も得ましたので、分かった限りのデータを併せ、表計算可能な表1作成となりました。
 参考資料として、オープンデータ終了前6ケ月の患者数を右列端に示しました。

   表1:”患者数”を定点数×定点患者数=平均患者数で見る一覧表

*厚労省の”平均患者数”は、下記お断りをご覧頂き、定点患者数への変更をご理解下さい。
   *”患者数”は2024/2/19~2024/2/25の、”平均患者数”は厚労省が述べるものを示します。
*表Ⅰの表計算の主軸は、厚労省の場合もAK数式の場合も、”患者数”となります。

 本題の前にお断りしておきます。
 当シリーズとしては、厚労省の ”平均患者数”は命名が不適当と判断し、その対応に、同省の報告する都道府県全ての”平均患者数”は、定点患者数に変更したことをご理解頂きたいと思います。
 不適当と判断した根拠は、定点数で”患者数”を割れば即平均患者数にはならないこと、同省の”平均患者数”は、本文(Ⅱ項)で示す定点患者数を表すグラフカテゴリーに属すること、同省が称する”平均患者数”なる言葉は結果を示すものですが、その経緯の説明がないこと等によります。
 文中で、”平均患者数”を止む得ず使用する際は、煩雑ですがその都度定点患者数に変更の旨をお知らせます。

 表1の厚労省定点数は、”平均患者数”(以後定点患者数に変更)で”患者数”を割ったもので、AK数式の定点患者数は、その定点数で”患者数”を割ったものになります。

 ここから本題に入ります。
 平均患者数は、謂わば表計算が目的とする結果の一つでもあります。同時にそれは、背景にある日本国の全患者数と常に相関する数値でなければ意味がないことになります。
 表1の”患者数”と厚労省”平均患者数”は、一見しただけでは両者の相関は判断出来ませんので、散布図で確かめることになり図1を示しました。

   図1:”患者数”と厚労省”平均患者数”、定点数との散布図

*左右図共に2024/2/19~2024/2/25の”患者数”との相関を求めたものです。

 図1左は、”患者数”と厚労省”平均患者数”の相関を求めたものです。プロットのばらつきは高度で、相関性は全く認められないことを示しています。更に、右図の患者数と厚労省定点数も、人口数が多くなるにつれてプロットのばらつきが顕著で、相関性が低くなることを示しています。
 つまり、厚労省の”平均患者数”は、日本国の患者数とは関係ありませんとグラフは述べているのです。
 表計算の過程を点検しましたが、これといった問題点も今の処見つかっていません。思い当たるのは、”平均患者数”は、定点患者数の間違いではないかと推測されることです。もしそうだとすると、定点患者数が日本国の全患者数を反映するには定点数が必要になりますが、定点数は、表1をご覧頂くと、既に定点患者数算定で使用しています。また、右図の大都市圏ほどプロットがばらつくのも気になり、結局、”患者数”そのものを調べておかねばと思うことになります。

 ”患者数”は、厚労省が決めた全定点の患者数合計を表します。”患者数”とオープンデータ終了前の患者数とを、人口数との相関を確かめることになり、図2に人口数を基にした両者の相関図を比較しました。

  図2:相関図・都道府県人口数を基にしたオープンデータ患者数と”患者数”

*左図は、オープンデータ終了前6ヶ月の都道府県別平均患者数です。
 *右図は、オープンデータ終了後の9ヶ月の定点観測下の”患者数”を表します。

 図2左は、「感染者数が人口数比化する」という当シリーズの提言の源となったグラフです。黒の患者数線グラフは、人口数の棒グラフにピークを等しくし、ぴったり重なって張り付いています。
 右図の赤い線グラフの患者数も、おおまかに見れば人口数に沿っていますが、波形は左図と違って、大都市圏(青の棒グラフの左側)で激しい乱高下を示します。赤い線グラフの深い切れ込みは、グラフの都道府県人口軸の東京都、大阪府、兵庫県、広島県、京都府等に一致し、表1の5都府県の患者数の少なさを表しています。

 問題は、図2右の波形変化が、感染状況の変化を伴わなずして、オープンデータ終了を境にして生じたのは何故かになります。厚労省が右図の波形変化を説明してくれれば済むのですが、波形変化に同省自身が関与している可能性があれば望めないこともあり、諸データを基にして、波形変化の原因を検討する以外にありません。

 図3左は図2右の”患者数”の散布図で、相関図同様に波形変化の主因が東京都、大阪府、兵庫県、広島県、京都府等の5都府県の患者数であることを示しています。5都府県の患者数を人口数比で補正した図3中央は、同じく図3右のオープンデータ患者数の散布図とほぼ同じ波形を示すのにご気付き頂ければと思います。 

     図3:図2右の散布図と5都府県患者数補正の散布図

*図左は図2右の、図右は図2左の、図中央は5都府県患者数補正後の散布図を表します。
        *図2右の赤線グラフの切れ込みが、右図の赤の直線下にある5都府県プロットに一致します。
     *図左は図2右と同図で、図中央は図2左の散布図で、図右は5都府県補正後の散布図です。

  図3中央と図3右波形がほぼ等しいのは、”患者数”が人口数比化している感染現況を現すと思われます。図3左の散布図を裏付けるような異変は、実際の感染経過上、5都府県に無かったことは明らかです。
 重要なことは、図3左の散布図が示す5都府県のプロットが、表計算や数式で表せるものとは思えないことです。特に東京都、大阪府、兵庫県の並びが不自然で、なんらかの人為操作を背景に推測せざるものでした。

 図2右の赤い線グラフの”患者数”波形は、その凹凸を大都府県に限らず中小都市圏にまで及んでいますので、人為操作の関与が広く及んだ可能性を推測させるものでした。波形変化が複雑な場合は、本来当事者が説明すべきことなのですが、当シリーズはその説明を知りません。

 操作的にしろ数式にしろ、図1右や図2中央の如き変化を顧みずして、同省は何のために患者数を変える必要があったのでしょうか。
 当シリーズとしては、都道府県定点数を、総定点数5000の枠内に収めることにその一因があったと推測します。数式があれば定点数の枠内調整は容易ですが、数式は極めて困難な課題です。定点数の数式化は当シリーズもお手上げで、AK氏のお陰でなんとか数式化を得ましたが、数式化を得なければ手動であろうが何であろうが枠内調整をしなければならなくなります。
 けれども、手動で操作的にデータを変えますと、個々のデータは関連性を失い、表計算は不可能になるのを覚悟しなければいけません。

 表1の定点数5164には、手動操作の苦労の跡が伺われますが、”患者数”データに人為的操作の疑いがある限り、”患者数”の信頼性は得られないことになります。人為的操作が関与するとあれば、データの関連性が失われると同時に、他項目との関連に必要な表計算はストップするか無関係を表示します。逆に、表計算に”患者数”が使えなければ、”患者数”は操作的な背景を持つ可能性を示唆することにもなるのです。

 定点数は、厚労省が決めて全国に指示しますから、各都道府県はその指示に従った患者数を国に報告することになります。ということは、定点観測に入ってからは、手動が関与しない患者数は日本国には残されていない可能性があるのです。何のための定点観測だったのかと思ってしまいます。

Ⅱ:定点数×定点患者数=平均患者数の数式

 表1の要である上の数式は、3変数の内2変数が判明すれば、残り1変数は自ずから明らかになることを示しています。しかし、今や人為操作の関与しない2変数を求めることは至難の現状です。
 厚労省は、毎週、”平均患者数”なるものを報告していますが、上の数式の左項の定点数と定点患者数の根拠を明らかにしていません。同省は人為による自作の定点数で各都道府県に患者数を算定させ、その患者数を自作の定点数で割って定点患者数(同省が言うところの”平均患者数”)にしていることになりますから、”平均患者数”は自作自演ということになります。

 定点数は、定点観測のファーストステップとなります。総定点数5000を、東京都の419を筆頭にして全都道府県に応分することになりますが、患者数の人口数比化(=提言)に従えば、人口数比という定数を応分すれば済むことになります。提言をご存じなければ、人口数での割り振りは思いつかないことと想像します。結局、定点数は、人口数ではなく"患者数”で割り振られることになります。後述しますが、これが次の問題を生むことになります(Ⅱの図4定点患者数グラフをご参照下さい)。
 
けれども”患者数”を操作的に変更しておきながら、定点数の数式化を求めるのは矛盾していますから、結局、初めから終わりまで、定点数は人為操作に頼らざるを得なくなります。
 
 表1の厚労省の報告を基にした定点数は、同省が報告する定点患者数で”患者数”を割ったものです。合計5164となった定点数を得て、定点患者数(同省いうところの”平均患者数”)を割り出したと推測されます。その定点数が各都道府県に通達され、その定点数に従って各都道府県が患者数を算定して、それを同省が”平均患者数”として報告するのが現状と思われます。

 ”患者数”を定点患者数で割った定点数とAK数式による定点数を、相関図と散布図で比較します。相関図は図4左、散布図は同中央となります。図4右のAK数式の散布図は、人口数と同一線上にあり高度な相関性を示しています。

    図4:厚労省報告に基づく定点数とAK数式による定点数

*図4左は、都道府県人口数と厚労省報告及びAK数式による定点数の相関図です。
 *図4中央は、厚労省報告に基づく定点数の散布図で、赤の基線から6都府県が外れ、
*図4右のAK数式による定点数は人口数との相関性は高く、重なって直線を形成。

 定点数は定数と思っている当シリーズとしては、図4左の厚労省報告に基づく定点数グラフに、変数で残る都道府県の存在に注目します。図4左を散布図で表した同中央図から判断しますと、9大都市圏の内6圏の定点数が該当していることが推測されます。これでは、定点患者数ならぬ動点患者数であって、定点観測を否定するようなものです。 
 当シリーズとしては、図4左の赤い線グラフの上下変動するピークが、図2右の各ピークとほぼ一致していていることから、手動化が推測される”患者数”が、定点数算定に影響を与えたと推測しています。

 各都道府県の事情によって、週ごとに定点数が変わる場合があるのは理解できます。けれども、B定点数はその平均値で代用可能ですし、AK数式の場合は基本的にAK数式による定数に変わりはありませんから、図3左の赤い線グラフの波形変化とは無関係と推測します。

 一方、図3左のAK数式による定点数は、定数化された緑色の線グラフとして、人口数波形に沿うようにして示されます。AK数式による定点数は”患者数”の影響を受けないので、都道府県それぞれが定数値を持ち、図3右の人口数と重なった直線グラフを呈することになります。

 次に当シリーズが注目する定点患者数について述べます。
 定点患者数は、=平均患者数/定点数ですから、分母分子が共に判明した時に得られる計算値となります。”平均患者数”=”患者数”にしますと、変動する定点数も決まります。それが手動で粉飾されれば、その”患者数”で得られた定点患者数も粉飾されます。

 図5上段左に、都道府県人口数と厚労省による”平均患者数”(当シリーズでは定点患者数)との相関、中央に都道府県人口数とAK数式で得た定点患者数との相関をグラフ化して示しました。

     図5:表1のB定点患者数とAK定点患者数

    *定点患者数と人口数は、B、C共に相関を認めない特有なグラフです(左,中央図)。   
*赤色欄の緑色欄の定点患者数は、相似した波形から大まかな相関を認めます(左図)。
*下段は、上段波形の散布図です。左、中央図で同様のグラフ波形は、両者が共に人口数とは全く無関係であることを示しています。左図の両者間に僅かの相関が窺えますが、両者とも人口数とはほぼ無関係であることを示しています。

 図5上下グラフは、定点数が患者数を基にして求められたことに異議を申し立てているのです。厚労省の患者数報告データベースをお持ちの方で、データベースの右列端に患者数平均欄を作られている方はお気付きと思いますが、図4上段は、同省が称する”平均患者数”(当シリーズが定点患者数とするもの)と称するものをグラフ化したものと同じです。この定点患者数波形は、同省ばかりでなくAK数式の場合も、人口数が関係しないのでそっぽを向かれています。図4下段グラフは、上段相関図の散布図ですが、患者数プロットは散乱し人口数との相関を否定しています。

 この特徴的な波形の原因は、Ⅱ項の平均数で太字で示しましたが、変数の定点数で定点患者数を求めたことに依ると推測されます。厚労省が報告する”平均患者数”は、この定点患者数のグラフカテゴリーに入り、”平均患者数”なるものは、定点患者数であることを示しているのです。

 図5上段グラフを、当初はデータが手動による故の作業拒否を推測しましたが、的外れではないものの、「定点患者数と平均患者数 新たな展開」は、それだけでは説明できないことを示唆するものでした。定点患者数と平均患者数では、全くその都道府県患者数背景が異なり、お互いが異質なものであることを理解する必要を感じさせました。これについては次回まとめ(2)で述べますが、定点という窓を通して感染を見た場合と、人口数という窓を通して感染を見た場合の違いがあることを示すものと思われました。

 図5中央のAK数式の定点患者数グラフは、定点数までは手動跡のあるデータの関与がありませんでした。けれども、そのpureな定点数で”患者数”を割れば、その瞬間、定点患者数は汚染されたものに変身するのです。 

Ⅲ:患者数=人口数比化の数式

 Ⅰ~Ⅱは、手動操作されてない pure な患者数データが必要なことを示してきましたが、Ⅰ項で述べたましたように、日本では、pureな患者数は記録として残されてないことが推測されます。当シリーズとしては、手動に一切関わりのない感染経緯を後世に伝える責任を感じます。

 世に残されているのは、厚労省による定点患者数だけです。それは統計的に役立たずとも、凡その感染推移を物語ってくれますから、手動跡があるからといってその存在全てを否定するわけにはいきません。同省とて、今になっては後戻りはできないことを自覚しているのではとも思います。
 パンデミック終末を象徴する提言なんぞ、もうどうでもよいのかもしれませんが、提言抜きでは定点観測は成り立たないのが現状なのです。

 当シリーズとしては、都道府県全ての患者数が、手動で等しく汚染されたわけではないと推測します。図2右を見ますと、手動の対象は大都市圏で多く中都市圏では少ない傾向があり、小都市圏ほど手動が関与する余地が少なくなっています。このことは、人口数最小の県である鳥取県に手動が及んだ可能性は、皆無とは言わないまでもかなり少ないと推測されます。

 図2左グラフで提言を主張する当シリーズとしては、鳥取県を起点とし、人口数比で患者数を逆算的に算定できないかを考えます。AK数式で定点数は定数化されています。手動が推測される都道府県ではなく、可能な限り事実に沿った患者数を原点にして、表1の人口数比で患者数を算定すれば、手動が大と推測される都道府県患者数の多くは除かれます。
 提言をご存じなければ図2左グラフを見る機会はありませんから、逆算的に患者数を求めることに理解を求めることは難しいかもしれません。提言は、文章や言葉で説明可能ですが、図2左グラフ無しで理解し且つ納得を求めるのは困難と当シリーズは判断しています。

 それでも、表2左3列目に人口数比、右列端に提言に基づいて鳥取県患者数273を基にした逆算的な手法による平均患者数、それに基づいた定点患者数、定点数(=黒字欄)を追加した表2を載せます。

   表2:表1に提言に基づく定点患者数と平均患者数を右端に追加

 *提言を基にした平均患者数は、人口最少県の鳥取県患者数273を起点にして算定し、
  *赤字欄の”患者数”定点数は、厚労省の”平均患者数で”患者数を割って得たものです。
*AK数式よる定点数は緑欄ですが、黒欄に共通するものです。    
*提言を基にした平均患者数60549は、オープンデータ平均患者数62632の3.4%減となります。

     図6:相関図・人口数と定点患者数及び平均患者数

*左図は、図4上段の左図、中央図と違って表計算が可能となりグラフ化されています。 
*右図は、図1左の人口数と平均患者数を入れ替えたものになります。

 図6右に、人口数に沿った平均患者数波形が計算され、AK数式で左の定点患者数グラフが得られました。手順は、右グラフを経て左グラフに至ります。人口数が関与した定点患者数を得ましたので、図4上段の波形から解放されたことになります。
 
 鳥取県には、定点患者数は保存されているでしょうが、患者数は使い捨てデータですから保存する義務はありません。試し算の仕様がないのです。かといって厚労省に、pureな患者数データがあるとも思えません。
 表2の黒色欄は、全て表計算に従ったものですから、鳥取県患者数の変動によって全てが変動することになります。例えば鳥取県患者数が273→263になりますと、平均患者数は60549→58331、定点患者数は496→478を同時に知ることになります。
 せめてもとの思いから、鳥取県を利用させて頂き、逆算的に患者数=平均患者数を求めました。収穫は、”患者数”の合計値 40551 が、1.5倍の60549 に推定し直されたことくらいかもしれません。
 これについてはまとめ(2)で述べます。

 平均患者数、定点患者数、定点数等の似たような文字が飛び交い、我ながら分かりづらい「まとめ(1)」となりました。文大意の変更は無いつもりですが、細かな文章変更が今後あるかもしれず、その節はご容赦賜りたく思います。

                   2024/9/18 精神科木暮龍雄


この記事が気に入ったらサポートをしてみませんか?