「K値」とは、感染症の基本モデルである「SIRモデル」の「再生産数」との関係だけで決まってしまう、質の悪い指数に過ぎないのではないか？

2020年7月26日 11:45

今月に入ってから、コロナウィルスの感染者数が再拡大の兆しを見せています。感染が再拡大しているからと言って、4月、5月のような経済損失を伴う大規模な自粛は避けたいところです。しかし、適切な経済活動のための基準というのが、なかなかはっきりとしたものがない状況です。

個人的には、感染症拡大SIRモデルの再生産数が１を超えたら、数値に応じて警戒を呼び掛け、それを1かそれ以下にするように調整する、というほうが分かりやすくてよいと思っています。世界的にもそれが普通だろうと思います。

しかし、経済推進派の人たちからすると、SIRモデルのあの基準で4月5月並みの自粛をされては経済が持たない、という人も多くいて、それもわからなくはありません。

そこで、最近経済推進派の中から推す声が多く上がっているのが、「K値」というものです。「K値」とはこちらの記事によると以下のようなものです。

中野教授は、累計感染者数を１週間前の累計感染者数で割った値の逆数を１から引いた値Kが、優れた指標になることに気付いた。１週間の間隔を取ったのは、曜日による検査数のばらつきが大きいことを排除するためである。一週間ごとにデータをまとめているので、日々の変動をキャンセルできる。Kを計算することで、時間に対する変化を安定的に読み取ることができる。

最初は何だこれ？という感じだったんですが、よくよく数式を書いて考えてみると、これって、よく言えば「SIRモデルの簡素版」、悪く言えば「劣化モデル」という感じに見えてきました。

それを式で表してみます。

上記の説明によると、0日目に感染が始まり、ｎ日目のK値は、新規感染者数がｘ(n) とすると、
K(ｎ)
= 1- {x(0)＋... +x(n-7)} / {x(0) + ... + x(n)}
={x(n-6) + ... + x(n)} / {x(0) + ... + x(n)}
ということになります。

感染者数の累計は日々とるものですが、K値の場合は変動をキャンセルするために1週間ずらしてあるので、それに倣って1週間ごとの新規感染者数を
X(m)として計算したほうが見やすくなるので、上記の計算式を週次にしてすこし簡単にすると、0週目に感染が始まり、ｍ週目のK値は

K(m)= X(m)/{X(0)+...+X(m)}

となります。

さて、ここで X(m) と X(m-1) との関係について考えてみます。

朝日新聞の記事によると新型コロナウイルスの潜伏期間は5日程度でその前後で感染させやすいことが分かっています。

ある人が発症し、感染させた別の人も発症するまでには推計で平均5・8日。先行研究から潜伏期間が5・2日を平均としてばらつきがあると仮定すると、他人への感染は発症の2・3日前から起き、0・7日前がピークだった。発症前に起きた感染は推計44%で、発症から7日後には急速に感染させにくくなっていた。

個人的には、数理モデル的になんの意味もなさそうなK値が、コロナウイルスの感染動向を見るのにいい感じに見えているのは、これが原因だと踏んでいます。

つまり、
「今週新規で感染した人が、来週新規で感染させる平均人数」
の再生産数（のようなもの）R を導入すると、数理モデル的には全く意味のない「曜日ごとの変動をキャンセルするため」にとった「7日」が、結果的にたまたまぴったりとフィットしてしまい、おおよそ以下の関係が成立していると考えられます。（感染して13日後にはほとんど他人には感染させないようですし。）

とりあえずはRは定数ということにしてみましょう。

今週の新規感染者数は、先週の新規感染者数のおよそR倍。
X(m) = R * X（m-1）

これを繰り返して、ｍ週の新規感染者は、0週目の R^m 倍。
X(m) = (R^m) * X(0)

これを先ほどのK値の式に入れてみると

K(m)
= X(m)/{X(0)+...+X(m)}
＝ {(R^m) * X(0)} / {(1+R + R^2+...+R^m)*X(0)}
= (R^m) / (1+R + R^2+...+R^m)

となり、ｍ週目のK値は、再生産数Rだけで表現されてしまいます。つまり、K値とは新しいモデルではなく、

「古典的な感染症の拡散モデルであるSIRモデルの域を全く出ていない『再生産数』をいじると出てくる数値に過ぎない」

ということになります。これを分析するくらいなら、再生産数を素直に観察したほうが、シンプルですし、意味があります。

提唱者らは、自身の予測が現実と外れると、「リセット」と称し、始点を変えて、ｍの値を恣意的に変えることを頻繁に行っているようですが、それなら最初から恣意的運用ができなくなるように、m=1で計算すればいいんですよ。だだ、それだと結局、再生産数を計算しているようなものですが。

だんだん数値がおかしくなってきて「リセット」せざるを得なくなるのは、今回のコロナウィルス感染拡大モデルにおいて「感染後2週間以上経過した人の数」が、「なんの意味もないデータ」だからでしょう。3月に亡くなった志村けんさんが、来週の感染者数の予測に影響を与えるか、ということを考えればわかりやすいでしょうか。逆に、それを利用すれば恣意的運用ができることになります。SIRモデルでは回復者として感染感度のなくなった母集団として考慮されますが、K値計算では累積値として無駄に積みあがります。

2月、3月頃の各国の感染者数のデータを入れて、いい感じのデータグラフに見えたのは、SIRモデル的には
「感染拡大が始まったばかりで、ほぼ全人口が感染感度がある状態だった」
「各国がまだ本格的な対応をしておらず、再生産数Rが、しばらくは、ほぼ定数だった」
というようなところが原因でしょう。

実際には「再生産数」は定数ではなく、時間で変化していくことにはなるでしょうが、そうだとしても、「再生産数だけで構成された関数」をいくらいじくっても、「将来の感染者数のピーク予測」ができる代物にはなりにくいと考えます。それがこのK値でできるのであれば、「再生産数」の加速度を計算するだけで、全く同じ結果になるはずです。

通常のSIRモデルの再生産数が1を超え、一定水準以上を長く続けているのが明らかであるにも関わらず、再生産数の変形値でしかないK値をこねくり回して、根拠のない楽観的なピーク予測をする方々の言動に引きずられ、何の対策も行わなかったら、新規感染者数は指数増加となり、数週間後には大変なことになるでしょう。

4月7日の緊急事態宣言の発令時には、コロナウィルスについてはよくわからないことが多く、再生産数を海外並みの2.5想定にしてしまったことで、必要以上の経済停滞を招いてしまったことは事実ではあろうかと思います。

しかし、だからと言ってその分野の定番として世界的にも分析実績の多いモデルを捨て、十分に検証もされていない劣化モデルに飛びつくのは、絶対にダメでしょう。

疫学数理の教授が国民の命を守るために行った研究と分析による提案を、経済停滞を理由に「専門家」の暴走だ、などと言って、「検証が必要だ」ということで、肩書のご立派な別の門外漢の専門家を連れてきて、自信満々に試作品を見せられて信じてしまい、検証もしないで採用して、政策に取り入れるという不思議なことが起こっています。

目前に迫っている、第2派を適切に予防するために、適切な分析モデルにより、適切な判断がなされることを切に願います。

コロナでろくに仕事もできないので、暇つぶしに数理モデルで今回のコロナウィルスの動向を分析しています。