見出し画像

世界の新型コロナウイルスの陽性者数・死亡者数・累積ワクチン接種者数の因果関係について

はじめに

 はじめまして.データ分析を業務の一つとしているzukeiと申します.
新型コロナウィルスが世界中にひろまってもうすぐ3年が経とうとしています.その間に新型コロナのmRNAワクチンが実用化されましたが,mRNAワクチンが感染者や死亡者を増やすという考えが,ネットなどで広まっていますし,それを指摘する論文もあるようです.一方で,それはあくまで相関関係であり因果関係ではないという反論もあります.
 これまで因果関係をデータから把握するのは困難であると考えられてきましたが,近年の統計的因果分析手法の発展により,因果関係をデータから推計できるようになってきました.そこで本稿では,全世界の新型コロナの陽性者数,死亡者数,(累積の)ワクチン接種者数の間にどのような因果関係が想定されうるのかを,因果探索という手法を用いて探ってみたいと思います.

分析するデータ

 ここでは,有名な Our World in Data のCovid-19データを使って,分析を試みます.使用したのは,Data on COVID-19 (coronavirus) by Our World in Data のCSVファイル(2020.1.1~2022.11.7)です.このデータの中で分析に使った項目は以下の通りです.

  • iso_code:国コード

  • date:日付

  • new_cases_smoothed:スムージングした新規コロナ陽性者数,以降「陽性者数」

  • new_deaths_smoothed:スムージングした新規コロナ死亡者数,以降「死亡者数」

  • new_vaccinations_smoothed:スムージングした新規ワクチン接種者数,以降「接種者数」

  • population:国の人口

 スムージングしたデータを使ったのは,国による報告日の差異や曜日による変動の影響を除くためです.元データに欠損があっても,ある程度であればスムージング処理で補完されますが,欠損期間が長くなると,スムージングしたデータでも欠損になるようです.念のため,このデータの陽性者数,死亡者数,ワクチン接種者数の報告状況を調べてみたのが図1です.最近は新型コロナのPCR検査を神経質に行う国が少なくなってきているといわれてますが,陽性者数や死亡者数の報告国数だけでみれば上昇する傾向がみられます.しかし,ワクチン接種者数の報告国は,2022年2月ごろから徐々に低下しています.ここでは,この低下をワクチン接種を行う国が徐々に少なくなっていって報告が途絶えたと解釈しました.こうした場合は打ち切りデータにする処理は行わず,(後述する)接種者数の累積値を継続して用いることにしました.ただし,ワクチン接種者のデータが揃うまでには,ある程度の時間がかかるようなので,今回は急激な減少が始まる手前の2022年9月30日までのデータで分析することにしました.ちなみに分析開始日は,ワクチン接種が始まる2020年12月3日としました.

図1 日別に集計した各項目の報告国数

 データの前処理として,陽性者数,死亡者数,接種者数に欠損がある場合は,0で埋めています.なお,ワクチン接種者数ですが,日別ではなく累積値とするのが国の接種状況を示す指標としては適切だと思われますので,日別の接種者数から累積値を求めて新たな項目を作成し,差し替えています.

データ分析の方法

 ここでは日本の研究者が開発した有名な因果探索手法の LiNGAM を用いて,陽性者数,死亡者数,累積接種者数の間にある,因果関係の向きと大きさを推計してみます.LiNGAMについてはネット上に様々な解説がありますが,なぜ(普通の)データから因果関係が推定できるのかについては,例えば以下のサイトがシンプルにまとめています.

 LiNGAMに入力するデータは,ある時点での国別の陽性者数,死亡者数,累積接種者数を人口で割ったものとなります(表1).

表1  LiNGAM分析用データのイメージ(標準化前)

 ただし,日別の陽性者数と死亡者数は,新型コロナの流行の有無で大きく変化するため,1日や短い期間で分析しても結果が安定しません.そこで,図3にように観測期間を設け,観測期間内の日の各項目の値の平均値を求め,さらにそれを各項目で標準化したものをLiNGAMの入力データとしました.観測期間は結果の安定性と追随性のバランスがちょうどいい感じに設定すべきですが,何度か試行錯誤して,今回は120日(約4か月)に設定しました.

図2 観測期間

分析結果

 観測期間の開始日を2020年12月3日から1日ずつずらしながら,都度データ集計とLiNGAMの分析を行いました.最終日の開始日は2022年6月10日です.以下の3つのデータの組み合わせで因果探索を行いましたので,順に説明します.

  1. 陽性者数と累積接種者数の因果関係

  2. 死亡者数と累積接種者数の因果関係

  3. すべての項目の因果関係

1. 陽性者数と累積接種者数の因果関係

 図3に観測期間の開始日別の,陽性者数と累積接種者の因果係数の変化を示します.青は「陽性者数→累積接種者」の方向の因果関係が確認された期間,オレンジは「累積接種者→陽性者数」が確認された期間です.因果関係の強さは縦軸の因果係数で示されています.
 初期はオレンジですが,この時期は被害が大きいところから優先的にワクチン接種が始まったと考えられます.しかし,被害の進展に接種が追い付いていないような状況があったのかもしれません.その後,2021年から2022年の初頭は陽性者が因果の発端となっていました.すなわち,国単位でみると「陽性者が多いと累積接種者も多くなる」という常識的な因果関係でした.しかし,2022年の2月ごろから「累積接種者が多いと陽性者も多くなる」という真逆の因果関係になっています.

図3 陽性者数と累積接種者数の因果係数の変化

2. 死亡者数と累積接種者数の因果関係

 図4に観測期間の開始日別の,死亡者数と累積接種者数の因果係数の変化を示します.初期の結果は,前述したコロナ流行下でのワクチンの打ち始めの影響が出ていると思われます.その後,2021年の10月半ばまでは両者に因果関係はみられませんでした.しかしそれ以降はオレンジ色の期間となっています.これは国単位では,「累積接種者が多いと死亡者も多くなる」という因果関係を意味します.(ただし,因果係数の値自体は,先の分析結果よりも低くなっています.)
 この結果は想定していなかったので,正直驚きました.

図4 死亡者数と累積接種者数の因果係数の変化

3. すべての項目の因果関係

 最後に,これら3つの項目を入れて因果関係を推定しました.結果はこれまでと違って単純には図示できないので,図5のように因果の方向を示す.パス図として表現しました.記号の意味は以下の通りです.

  • case:陽性者数

  • death:死亡者数

  • vax:累積接種者数

 パス図は比較的安定していますが,ある時期になると関係が変化します.Phaseはそれらパス図の変遷を示しています.わかりやすい例としてPhase 2が挙げられます.この場合,「陽性者が多いと死亡者と累積接種者も多くなる」といった,矢印の向きに沿った因果関係になります.矢印の横の数字は因果係数で,陽性者数と死亡者数の因果関係のほうが,陽性者数と累積接種者数のそれよりも強いことを意味しています.

図5 陽性者数,死亡者数,累積接種者数のパス図の変化

 全体的に先の二つの分析結果を合わせたような結果となっているといえますが,特に2021年はPhase 4の因果関係が7か月ほど継続しており,この年の主たる因果関係だったと思われます.これは,「死亡者が多いと陽性者も多くなるが,ワクチン接種者は反対に少なくなる.加えて,陽性者が多いとワクチン接種者も多くなる.」といった因果関係になります.死亡者が多い国はワクチンの接種者が相対的に少ないことを意味するので,世界的にみれば,この時期における新型コロナの重症化抑止としてのワクチン接種には一定の意義があったのかもしれません.この時期は武漢型に近いアルファ株やデルタ株が流行していたので,新型コロナの被害抑制だけで見れば,武漢型のワクチンがそれなりに機能していたのかもしれません.
 しかしオミクロンが流行する2022年になると状況は一変し,最終的にPhase 8のように「累積接種者が多いと死亡者や陽性者数も多くなる.加えて,死亡者が多いと陽性者も多くなる.」といった因果関係になります.すなわち,ワクチンの累積接種回数の多さが因果関係の起点になっている状況が,2022年1月から継続しているのが2022年の状況といえます.ただし因果関係の強さはPhase 4のそれに比較するとやや弱いので,因果関係としては認識されにくいのかもしれません.

まとめ

 オープンデータと因果探索の手法を用いて,全世界の新型コロナの陽性者数,死亡者数,累積接種者数の間の因果関係を抽出しました.結果,2021年と2022年でワクチン接種の意義が反転するような因果関係の変化が見られました.あくまで統計的なデータ分析から得られた結論であり,医学的な意味での因果関係までは私にはわかりません.しかし,この結果と起きている現象を照らし合わせると,私としては結構納得感がありましたので,共有させていただきました.

この記事が気に入ったらサポートをしてみませんか?