新型コロナ - 都道府県別 Rt (2) - モデルの考察

NEJM に”Wrong but Useful — What Covid-19 Epidemiologic Models Can and Cannot Tell Us”と題する視点があったので、rt.live の GenerativeModel に照らし合わせてモデルを簡単に考察してみる。

1. Purpose & Time Frame - 目的と時間的枠組

1. What is the purpose and time frame of this model? For example, is it a purely statistical model intended to provide short-term forecasts or a mechanistic model investigating future scenarios? These two types of models have different limitations.

訳:このモデルの目的と(適用する)時間の枠組みは何でしょうか? 例えば、短期の予測を提供するための純粋に統計的なモデルなのか、または将来のシナリオを精査するための機構的なモデルなのか。これら2種類のモデルには異なる制限が付いてきます。

ここで、statistical model (統計的モデル)は、データ内の各変数とその関係を統計的に検討するのに留まるのに対し、 mechanistic model (機構的モデル)では、各変数には自然科学の法則に基づく意味がありそれぞれの関係に何らかの構造を仮定し、calibration(更正)しながらデータに合わせていくモデル、との理解(Ref.: 1,2) 。

Rtを求めるのに使っているrt.liveのGenerativeModelは、前者に当てはまり、「今の国民の行動を促す」、という目安・短期予想には使えるだろう。

2. Assumptions - 仮定

2. What are the basic model assumptions? What is being assumed about immunity and asymptomatic transmission, for example? How are contact parameters included?

訳:モデルの基本的な仮定は何でしょうか?例えば、免疫と無症状感染については何が想定されていますか?接触パラメータはどのように含まれているのでしょう?

rt.liveではR_0 =2.0 and 感染者が感染した日から陽性と診断された日までを潜伏期間とし 5 日間と仮定している。

3. Uncertainties - 不確かさ

3. How is uncertainty being displayed? For statistical models, how are confidence intervals calculated and displayed? Uncertainty should increase as we move into the future. For mechanistic models, what parameters are being varied? Reliable modeling descriptions will usually include a table of parameter ranges — check to see whether those ranges make sense.

訳:不確かさ(uncertainty)はどのように表示されていますか?統計的モデルの場合では、信頼区間(confidence interval)はどのように計算されて表示されていますか?将来に進むにつれて不確かさは増加します。機構的モデルの場合には、どのパラメタが変更されているのでしょうか?信頼できるモデルの詳細には、通常パラメタの範囲を記載した表が付いています。これらの範囲に意味があるか確認してください。

rt.live のGenerativeModelではpymc3によるBayesian inference (ベイズ推定)を arviz を通してresultsに書き出している(data.py内で)が、そのときにarviz.hdi (highest density interval, 最高密度区間)を求めている。 

4. Data - データ

4. If the model is fitted to data, which data are used? Models fitted to confirmed Covid-19 cases are unlikely to be reliable. Models fitted to hospitalization or death data may be more reliable, but their reliability will depend on the setting.

訳:モデルがデータにフィットされている場合には、どのデータが使用されていますか?確認されたCovid-19感染者(cases)にフィットされたモデルは、信頼性が低いでしょう。入院や死亡のデータにフィットしたモデルの方が信頼できるかもしれませんが、その信頼性は設定に依存します。

全ての人口がテストされない限り、感染者数は不確かなので信頼度が低い。また、感染時の空間・時間情報もそれぞれ異なるのでより複雑になる。GenerativeModelでは感染者数をデータとして使っている。

5. Context - 属性

5. Is the model general, or does it reflect a particular context? If the latter, is the spatial scale — national, regional, or local — appropriate for the modeling questions being asked and are the assumptions relevant for the setting? Population density will play an important role in determining model appropriateness, for example, and contact-rate parameters are likely to be context-specific.

訳:モデルは一般的ですか、それとも特定の属性を反映していますか?後者の場合、国・地域・地元などの空間的スケールは、モデルが解明しようとしている疑問に対し適切であり、仮定は設定に関連していますか?例えば、人口密度はモデルの適切性を決定する上で重要な役割を果たし、接触率パラメタは属性固有であるでしょう。

GenerativeModelのモデルは一般的。オリジナルはアメリカのデータに適用しているが、国別にRtを求めるようなモデルはまだ無いようだ。全て同じパラメタを使用している。都道府県ごとにRtを求めているが、データの極めて少ない県もあり、モデルに属性を持たせることは困難だろう。

この記事が気に入ったらサポートをしてみませんか?