外れるための予測

新型コロナ感染者数のが増えそうだという予測をすると、煽っている、と批判する人がいます。しかし予測をするのは、当てるためではなく注意喚起をして最悪の事態を回避することも大きな目的だ、という話です。

予測とは、過去のデータを使って今後どのようになるのかを推定することです。その過程で様々な仮説がたてられます。一番単純な、しかし重要な仮説は、今までと同じ傾向が今後も続くなら、というものでしょう。まずこの「今までの傾向が今後も続く」と仮説をたて、これに様々な変化の可能性を仮説に盛り込んでいくことで、様々な異なるシナリオでの予測を行っていくことになります。

例えば新規感染者数は、今までの傾向が今後も続くのであれば、つまり実効再生産数が変わらないならば、指数関数的な増加または減少になります。感染の広がり方は、何もしなければ指数関数の形になる、ということが基本にあるため、最も単純な予測は指数関数的増減になる訳です。

この単純予測の形はモデル毎に違います。わかりやすいのは、例えばマラソン。もしも同じペースで走り続けられたとした場合、1分後にどこまで進んでいるかを考えてみましょう。速度が一定ならば、距離は速度x時間で計算できることは、明らかですね。1分程度の短い時間なら、予測精度は比較的高いことが期待できます。しかし実際には、選手の疲労度合、風、勾配など、様々な要因で速度が変わってくるでしょう。これを数値化して推定に使えれば、もう少し長い時間でも精度の高い予測ができるはずです。

感染者数の予測でも同様です。予測の基本は実効再生産数が一定の指数関数的増減。それに加え、どれだけ人流が増えるか、3密回避行動をどれだけ取れているか、マスク使用状況や、ウイルス自体の感染力や人々の抗体の状況など、多くの要素を要素として加えることによって、感染状況を予測することになります。


ところで統計学で行う推定は、多くの場合、区間推定が利用されます。不確定要素を加味し、例えば50%や95%の確率で起きるであろう範囲を計算することで、少し幅のある予測になります。感染者数の予測でも、楽観的な予測から厳しめの予測など、実は幅がある推定が使われています。


そしてその予測(シナリオ)をどう扱うか。ある想定の時、望ましくないことが起きる可能性が高いと予測された場合に、そのような結果にならないためにできることはいろいろあるはず。施策によって、最悪の予測が起きないようにする。これも予測する1つの目的と言えます。
まさに最悪を想定して最善を尽くす、ですね。


(予測には、信頼できる正確なデータが不可欠であることは、言うまでもありません。)