対数増殖率とSIRモデルでモニタリングしたCOVID-19の流行状況

これはCOVID-19 epidemics monitored through the logarithmic growth rate and SIR model https://doi.org/10.1101/2021.09.13.21263483  の解説記事である。ほんとは翻訳するつもりだったのだけど、イントロの次にMaterials and methodsがあり、長い長いリザルトが始まるのだが、翻訳していて「あー無理だ」とおもった。日本語にしても簡単にならないのだ。もともとこれはちょっとふつうの医療従事者が読めるような内容ではない、普段からシミュレーションとかやりつけてないひとには、何が書いてあるのかわからないとおもう。(レビューイングに時間かかってる理由だろうな)

 そもそもなんでこんな長くなったかというと、本質的にこれはふたつの論文を合体させたものだからだ。ひとつはシミュレーション、もうひとつは実データの解析である。解析するために新しい方法論が必要で、そのためにシミュレーションが必要になったのだ。

 これまでこの分野は科学者が不在にしていたんだとおもう。お医者さんとデータ屋しかいなかったのだろう。いま出回っている、たとえばR0をもとめる方法論とか、科学者の目からするともうめちゃくちゃだ(その具合はイントロに)。そしてたぶん、きっちりシミュレーションできるひとが皆無だったのではないか。だから平気でR0=1.2みたいな値を表に出せてたんだろう。R0が、つかう計算方法でぜんぜん値がかわっちゃうのは昔から知られていたらしい、いくつか論文がでている。そこに気づいていて放置するかよ普通? これが、科学者がいなかったんだと思う所以である。「だれが計算したかで結果がかわる」のは科学ではない。

 まあともかくシミュレーションの結果としては、R0は最低でも2くらいないと流行は起きないことがわかった。そして、しかし、USAとかインドとかすごいことになっちゃってる国でも、R0はこの程度なのだ。この数字は実際のとこあまり役に立たないとおもう。定数というには不安定すぎるし。

 もっと重要なのはτ、平均感染期間である。そしてR0のかわりに倍化時間を使うほうが実際的だとおもう。どちらも、対数増加率Kをみればすぐにわかる。そして対数増加率Kはじつに簡単に算出できる。現場ではこれを使うべきだろう、いろいろいじってR0を求める意味はほとんどない。そこにこだわるひとのための算出方法も論文にのってるけど。

 そして流行を収束させるただひとつの方法は平均感染期間τを小さくすること。そのためにできることは、感染者の隔離である。東京はオリンピックのときこれが世界最悪のレベルで長期化していた。あの悲惨な流行の原因はこの一点にある。PCRをオリンピックが使い切っちゃていたので感染者があぶりだせなかったこと、自宅療養にたよって隔離しなかったこと。どちらも政策の失敗だ。オリンピック後にはたちまちもとのレベルにもどり、流行が収束したことがデータからも明らかになっている。また鳥取がこの点において世界有数の優秀さを示していた。自治体ごとにすごく差があるのだ。

ちなみに隔離が必要な期間だけど、一律に決めることはできない。1週間とか10日とか、まったく非科学的なことだ。これは感染者ごとに違うからだ。当然、個々人にPCRかけないと判断できない。

この論文を書いたときはまだオミクロンはでていなかったが、すでにデルタが予防接種の効果を台無しにしていた。集団感染をコントロールするという意味では予防接種の効果はこの時点でも限定的なものだった。

 以下、イントロダクションまで日本語を載せる。興味がある方は原典にあたってください。 

Abstract

 SIRモデルは、流行の拡大を分析・予測するためによく使われる。このモデルでは、患者数は初期と後期で指数関数的に増加し、減少する。したがって、これらのフェーズでは、感染症患者の対数は、対数増殖率Kと呼ばれる一定の速度で変化する。 しかし、コロナウイルス感染症2019(COVID19)の流行の場合、Kは決して一定ではなく、直線的に増減するため、SIRモデルの結果は現実の状況とは一致しない。この現象の原因を明らかにし、COVID19の流行の広がりを予測したい。そこで、単独流行の発生に伴うKの変化を観察するために、ある状況をシミュレーションした。特に,R0が2以下の場合,シミュレーションが不安定になるため,入力の代わりに出力を使用することを検討した.また,Kの値を変化させたときのτやR0との関係をシミュレーションし,データからこれらのパラメータを推定する方法を開発した.この方法を用いて、279の国と地域の疫学データを分析し、よくコントロールされた地域とコントロールされていない地域の特徴を明らかにした。シミュレーションでは、K値は実データと同様に直線的に増加・減少した。基本再生産数R0の違いはKの変化の傾きに現れ、平均感染時間τはKの負のピークに現れ、τの平均は12日であった。Kの変化から推定されるR0とτを用いることで、SIRモデルにおいて患者の変化を近似的に表すことができた。このことは,COVID-19の流行を評価するモデルとして適切であることを裏付けている.実際のデータでは、Kが連日陽性であった場合、数週間後に患者数が増加することが確認された。また,Kの負のピークを0.1まで小さくできないと,患者数が多いままとなり,死亡率も増加した.流行をコントロールするためには、毎日Kを観察し、より早く患者を発見し隔離することでτを小さくすることが重要である。しかし、ワクチン接種の効果は限定的である。

 

Keywords: compartmental model; exploratory data analysis; principle of parsimony; parametric analysis; data distribution

 

Introduction

疫学などでさまざまなデータを解析するためには、適切な数理モデルが必要だ。モデルがなければ、数字の増減を理解することはできない。モデルによって、特定の考え方に沿って数字を処理することができる。モデルが適切かどうかを数学的に判断することはできない。しかし、少なくとも科学的であるかどうかを見分けることはかなり容易である。

 モデルは常に現実よりも単純であり、そのためにモデルから計算または推定された結果と現実との間にギャップが生じる。このギャップは、使用するパラメータを増やすことで解消できるが、多くの場合、そのパラメータはある仮定のもとに設定されている。この仮定は検証されなければならないが、多くは未検証のままで使われる。この状況はあまり科学的とは言えない (1)。科学では、このような仮定をすればするほど、結果の客観性が失われるため、このような選択肢は避けられる。これから、いわゆる吝嗇なパラメトリックの考え方が生まれる。科学で使える数学モデルは必然的に単純なものになる。

 疫病のデータ解析は科学的に行う必要がある。検証されていない仮定がモデルの根底にある場合、その仮定によって解析結果が異なる。仮定を受け入れる人と受け入れない人の間で議論することは困難であるため、情報を共有することができない。さらに、流行データの解析結果は、パンデミックへの対応に関する政治的な判断に関わるため、被害を拡大させる可能性がある。このようなシナリオでは、反証が可能であるという科学の基本的な性質が重要になる。

COVID-19の伝染病の研究に使われたモデルのいくつかを考えてみよう。比較的初期の報告では、感受性(S)、曝露(E)、感染(I)、回復(R)者を記述するSEIRモデル2に類似したモデルが使用された。これは、ラプラス変換を用いて単純化された直列間隔の分布を仮定して分析されたものである (3)。これらの仮定の正しさは、まだ検証されていない。さらに、コロナウイルス感染症2019(COVID-19)のデータではなく、SARSやMERSのデータを用いて手法を適応し、様々な推定値を構築している (2). また、Sを全人口と仮定したより単純なSIRモデル (4)を用いて、平均感染時間τとR0を推定し、R0は1.23と非常に低い値であると結論づけた者もいる。また、死者(D)と回復者を分離したSIRDモデル (5,6)を用いたものもある。このモデルを表すヤコビアン行列をそれぞれの考え方に沿って考案し、次世代行列 (7)の最大固有値としてR0を推定した。これらのモデルはいずれも様々な仮定に基づいているが、流行が深刻であったインドやインドネシアではR0がほぼ1.0と報告されており、これらのモデルの妥当性には大きな疑問がある。より複雑な修正SIRDモデルを用いた研究では、10種類ものパラメータが設定され、R0はもはや用いられていない (8)。 インドでの感染に関する研究では、5つのモデルから得られたパラメータと予測値 (9)を並行して比較した。各モデルは様々な予測をすることができたが、結論は全く異なっていた。

モデルによってR0の推定値が異なることはよく知られている (10,11)。したがって、本来客観的なパラメータとして期待されるR0は、「モデルとその前提条件が妥当である場合のみ」有効である。これは、吝嗇でないアプローチに起因する問題である。

コンパートメントモデルの中でも、SIR (12)は現代の疫学で使われている最も基本的な数学モデルであり、コンパートメントモデル群 (13)の基礎となっているものである。このモデルは、「材料と方法」の項で示したように、最小限の仮定だけで成立するという利点がある。このモデルは、対応する個体数の変化速度を連立微分方程式で表すことにより、動態を説明するものである。

SIRモデルによると、感染者数は感受性個体の割合が減少するまで指数関数的に増加し、その後一定期間ごとに半減する。指数関数的な増減の各段階において、Iの対数は時間とともに直線的に変化する。対数成長率Kは直線的な変化の傾きを示す。従って、安定相のいずれにおいても一定の値をとるはずである。

しかし、COVID-19の症例に関しては、Kは直線的に増減し、一定になることはないため、実際の症例はこのモデルには直接当てはまらない (14)。この矛盾は、COVID-19の流行状況を理解し予測するために、SIRや関連するモデルを使用することに疑問を投げかけるものである。これは、重症急性呼吸器症候群コロナウイルス2型(SARS-CoV-2)の亜種が、限られた人口のみを対象とする小さな流行を短い間隔で繰り返すためと考えられる。もし、前のピークが収束する前に次のピークが到来すると、指数的上昇の初期段階が前のピークに覆い隠されることになる。その場合、二相性のパターンが変化する。この可能性を検証するために、本研究では、探索的データ解析 (15)を用いて、シミュレーションを行い、実際の流行データとの比較を行った。

ここでは、最もシンプルで基本的なモデルであるSIRモデルのみを使用しました。例えば、SIERモデルでは、SIRよりも1つだけパラメータが多く、感染してから他者に感染するまでの潜伏期間を用いる。この潜伏期間は患者によって異なる可能性があるが、感染時期の特定が困難なため、ほとんど測定されていない (16-18)。また、速度に影響を与える他のパラメータと区別がつかないため、データから感染数を推定することは困難である。曝露した患者の半減期を共通に推定することで、SEIR モデルを適用することも可能であるが、この方法では証明困難な仮定が増加する。また、COVID-19における潜伏期は、症状が現れる前に感染期が始まるため、おそらく長くはないだろう (16-18)。

 モデル自体の反証可能性に加え、モデルのデータへの適用とそこでの計算方法も重要である。先行研究 (4)とは異なり、初期Sに国全体の総人口を用いず、またそれに基づいてR0を推定していない。これは、単純に感受性者の数の評価が難しいからである。このような流行があるにもかかわらず,COVID-19はまだヒトに馴化する過程にあり,感染力は限られている(19);さらに,行動の変化により多くの人が感染を回避することが可能である。そのため,Sについて全人口を対象とすることは現実的ではない.その代わりに,モデルに頼らずに評価できる対数増殖率Kから,より客観的にパラメータを推定している.また,本研究では,パラメータを推定する際に,新たな仮定を設けることなく行っている.


References

 

1 Ellis, G. & Silk, J. Scientific method: Defend the integrity of physics. Nature 516, 321-323, doi:10.1038/516321a (2014).

2 Zhao, S. et al. Preliminary estimation of the basic reproduction number of novel coronavirus (2019-nCoV) in China, from 2019 to 2020: A data-driven analysis in the early phase of the outbreak. Int J Infect Dis 92, 214-217, doi:10.1016/j.ijid.2020.01.050 (2020).

3 Ma, J., Dushoff, J., Bolker, B. M. & Earn, D. J. D. Estimating Initial Epidemic Growth Rates. Bulletin of Mathematical Biology 76, 245-260, doi:10.1007/s11538-013-9918-2 (2014).

4 Lounis, M. & Bagal, D. K. Estimation of SIR model’s parameters of COVID-19 in Algeria. Bulletin of the National Research Centre 44, 180, doi:10.1186/s42269-020-00434-5 (2020).

5 Al-Raeei, M. The basic reproduction number of the new coronavirus pandemic with mortality for India, the Syrian Arab Republic, the United States, Yemen, China, France, Nigeria and Russia with different rate of cases. Clinical epidemiology and global health 9, 147-149, doi:10.1016/j.cegh.2020.08.005 (2021).

6 Zuhairoh, F., Rosadi, D. & Effendie, A. R. Determination of Basic Reproduction Numbers using Transition Intensities Multi-state SIRD Model for COVID-19 in Indonesia. Journal of Physics: Conference Series 1821, 012050, doi:10.1088/1742-6596/1821/1/012050 (2021).

7 van den Driessche, P. & Watmough, J. Reproduction numbers and sub-threshold endemic equilibria for compartmental models of disease transmission. Mathematical Biosciences 180, 29-48, doi:https://doi.org/10.1016/S0025-5564(02)00108-6 (2002).

8 Sen, D. & Sen, D. Use of a Modified SIRD Model to Analyze COVID-19 Data. Industrial & Engineering Chemistry Research 60, 4251-4260, doi:10.1021/acs.iecr.0c04754 (2021).

9 Purkayastha, S. et al. A comparison of five epidemiological models for transmission of SARS-CoV-2 in India. BMC Infectious Diseases 21, 533, doi:10.1186/s12879-021-06077-9 (2021).

10 Delamater, P. L., Street, E. J., Leslie, T. F., Yang, Y. T. & Jacobsen, K. H. Complexity of the Basic Reproduction Number (R(0)). Emerging infectious diseases 25, 1-4, doi:10.3201/eid2501.171901 (2019).

11 O'Driscoll, M., Harry, C., Donnelly, C. A., Cori, A. & Dorigatti, I. A Comparative Analysis of Statistical Methods to Estimate the Reproduction Number in Emerging Epidemics, With Implications for the Current Coronavirus Disease 2019 (COVID-19) Pandemic. Clinical infectious diseases : an official publication of the Infectious Diseases Society of America 73, e215-e223, doi:10.1093/cid/ciaa1599 (2021).

12 Rahimi, I., Chen, F. & Gandomi, A. H. A review on COVID-19 forecasting models. Neural Comput Appl, 1-11, doi:10.1007/s00521-020-05626-8 (2021).

13 Heng, K. & Althaus, C. L. The approximately universal shapes of epidemic curves in the Susceptible-Exposed-Infectious-Recovered (SEIR) model. Scientific Reports 10, 19365, doi:10.1038/s41598-020-76563-8 (2020).

14 Konishi, T. Effect of control measures on the pattern of COVID-19 Epidemics in Japan. PeerJ 9, e12215, doi:https://doi.org/10.7717/peerj.12215 (2021).

15 Tukey, J. W. Exploratory data analysis. (Reading, Mass. : Addison-Wesley Pub. Co., 1977).

16 Guan, W.-j. et al. Clinical Characteristics of Coronavirus Disease 2019 in China. New England Journal of Medicine 382, 1708-1720, doi:10.1056/NEJMoa2002032 (2020).

17 Lauer, S. A. et al. The Incubation Period of Coronavirus Disease 2019 (COVID-19) From Publicly Reported Confirmed Cases: Estimation and Application. Annals of internal medicine 172, 577-582, doi:10.7326/m20-0504 (2020).

18 Li, Q. et al. Early Transmission Dynamics in Wuhan, China, of Novel Coronavirus–Infected Pneumonia. New England Journal of Medicine 382, 1199-1207, doi:10.1056/NEJMoa2001316 (2020).


この記事が気に入ったらサポートをしてみませんか?