見出し画像

新型コロナウイルス感染モデル

振り返りまとめを書きました。そちらをまずお読みください

個人的に開発している世界全体を対象にしたコロナウイルス感染モデルについて解説します。単純化したモデルなので、予測は当たらないと思ってください。

基本的な考え方

ベースになっているのはよく知られているSIRモデル(susceptible, infected and recovered model)です。これはこのように考えます。S[t]を時点tで未感染の人の数、I[t]を今感染している人の数(アクティブ)、R[t]を回復した人の数とします。感染している人は各時点である確率rで未感染の人に病気をうつします。今感染している人はある確率aで回復します。一旦回復すると免疫がついてもう病気にはかからなくなります。これを式にまとめてみましょう。


画像1

世界モデル

SIRモデルを世界全体に拡張して、外国からの影響も考えることにします。まず、S(t), I(t), R(t)はベクトルになります。Pも各国の人口ですからベクトルです。また、rは行列になります。行列であることを強調するためRと書くことにします。すると、

画像2

ここで⚪︎や⚪︎に斜線は要素ごとの積や割り算を表します。回復率aについては国に依存しないものとします。aについてはコロナウイルス の性質による面が大きい一方、増殖率Rはその国の生活習慣等に大きく依存するため、この仮定はある程度適切であると思います。

潜伏期間

次に潜伏期間を導入します。潜伏期間をLすると、現在の感染者の増加を決めるのはL時点まえの感染者と未感染の人の数ですから、

画像3

となります。厳密にはこれは問題があって、L時点前のSは現在よりも大きいため、場合によってはIの増加がSよりも大きい、つまりS(t+1)がマイナスになる可能性があります。しかしこの可能性はとりあえず無視します。(実装では雑に考慮されています。)

検査率と封じ込め

新型コロナウイルス の感染症で難しいのは、かなりの割合の人に症状がない、ということです。また、検査能力も限られているため、完全に感染者数を把握しているとは考えられません。また、感染を封じ込める一定の政策が取られるはずです。

ここではこれを人口Pを実際の人口ではなく、「実効人口」と考え統計的に推定することにします。この仮定によれば、政府はある人口Pの集団を完全にモニタリングしており、感染はこの集団の中に封じ込めらています。この集団のなかで感染を遅らせたりする対策は取られません。つまり上のRは一定です。

これは極めて雑な仮定ですが、複雑すぎるモデルを採用するとパラメーターを適切に推定できなくなるため、あえてこうしています。

パラメーター推定

上の式では、R,P,aという未知のパラメーターがあります。未知パラメーターはベイズ的にその分布を推定します。実際の予測時にはその分布をサンプリングして複数のシミュレーション(今回の場合は5000回)を実行することにより、予測の幅も求めることができます。推定にはStanというツールを使います。使用したStanモデルはGithub上に置かれています。変なガウスノイズが入っていていますがそうしないとうまくフィットしませんでした。

予測

パラメーターをベイズ推定すると、最善のパラメーターだけでなく、想定されるパラメーターの分布が与えられます。このパラメーターの分布からランダムにサンプリングしシミュレーションを繰り返し行います。これにより、予測値の精度も求めることができます。

結果

いくつかの国では、比較的挙動をよく再現しています。以下では現実のデータとの比較ができるよう、3月5日の時点からシミュレーションを開始しています。値はアクティブ(現在感染している)な患者の数を表しています。

青の実線が公式に報告された値、オレンジの波線が予測の中央値、赤線が下から25%の値(それより下に予測値の25%がある)、緑の線が下から75%、つまり75%の予測値がそれより下にあることを表しています。なので、赤線と緑の線の間に入る確率が50%と予想しています。

中国

画像4

韓国

画像5

比較的よくあっているように見えます。

日本

画像6

ノルウェー

画像7

まだ予測の範囲内ですが突き抜けそうに見えます。全体として、ピークを過ぎると予測がしやすいようです。また、ピークが早く来すぎる傾向があります。

だいたい毎日データを更新していますが、その度に挙動が変わることがあります。中央値と25%パーセンタイルはあまり変わりませんが、75%パーセンタイルが激しく変動します。どうも極めて大きなPの推定値が入ってくることがあるようです。

以下は世界全体の(アクティブな)患者数の推移と国別の感染者予測です。ただし世界全体といっても、現在累計で1000人以上の患者が出ている国だけが対象となっています。今後インドのような大国がもし入ってくれば様相は変わるかもしれません。

画像8

4-5月がピークとなる予測をしており、比較的楽観的でしょう。世界全体の感染者は50%の確率で、60万人から90万人の間になると予測しています。国別ではアメリカとスペインが深刻と予測しています。

画像9

詳しい計算はやはりGithub上にあります。データセットはJohns Hopkins大学作成のものを使用しました。

この記事が気に入ったらサポートをしてみませんか?