見出し画像

素人ひと月データサイエンス「新型コロナウイルス感染症(COVID-19)」例:東京都

新型コロナウイルス感染症は、いつどのように収束していくのか。

20年5月3日現在、政府は4月7日に発令した緊急事態宣言を専門家会議の意見を踏まえ、5月6日までとしていた期限の延期を発表している。
報道では、様々な専門家の意見や、軽症者・重症患者数、陽性率など様々な数字が登場させながら日々情報を伝えているが、恐らく最も有名な「実効再生産数」という数字も「〇〇という専門家によると〈〜では“これくらい”という数字〉」で、それを導き出す方法を検索しても、ふつーのひと(デザインを生業にしている私)にとっては難読漢字のようで、どのようにこの問題を自分で理解・判断すればよいのだろうか。

そんな中、「新型コロナ:自らできる感染予測シミュレーション 神は細部に宿る:データ駆動とフェルミ算を身につけよう(2020.3.27(金)伊東 乾:https://jbpress.ismedia.jp/articles/-/59899)」という記事と出会い、4月からこれまでの間、週間で陽性者数(感染者数)の予測に取り組んでみた。
これによって、例えば毎日の陽性者数を、今日は増えた、昨日より減ったというように見ることがなくなり、今週はこれくらいの数字に最終的に到達する、それと比較するという視点を持つことで報道に一喜一憂することがなくなった。
このnoteは、そういったこれまでをまとめたものです。


●収束を予測する方法

収束に向けては、はたまた終息なのか、実際のところ〈音声が指す情報〉では分からない。しかし、助成申請が大変だといわれても、あとどれくらい続くのかと想定できれば取り組むし、発表されている複数の情報を入手して比較検討するのにも、自分の判断基準はあってもよいと考え、予測に取り組んだ。

方法は、東京都が発表するサイト「新型コロナウイルス感染症対策サイト(https://stopcovid19.metro.tokyo.lg.jp/)」を確認し、エクセル(後半からはGoogleスプレッドシート)へ入力し、日曜日から土曜日までの週単位で、前述の記事のように組んである以下の計算結果を見るだけの簡単なもの。

▶前週の累計×r(率)=今週の累計
→今週の累計÷前週の累計=r(率)
⇒当該週の累計数×rが次週の予測数となる

「r」を出すことで等比的(割合・比)で考えるアプローチで、等差的に増分を比較・伝達する報道とは異なり、「等比的な増加が多ければ、被害が増大しているだけでなく、感染そのものが加速している」と記事にある視点を持つことと、報道とは異なる週単位での比較とした。

取り組んでいる最中の4月16日には「小池都知事が発表する数字には嘘がある 田中良・杉並区長が“医療崩壊”の現場から怒りの告発 | 文春オンライン(https://bunshun.jp/articles/-/37284)」という記事が出たり、その数字にも〈様々な都合〉があるだろうと想像はしていたが、それらを踏まえて途中から加えた退院者数についても読んでもらいたい。


  *    *    *    *


20年1月23日午前10時に発生源である中国・武漢が「都市封鎖(ロックダウン)」された。この時中国での死者数が41人、患者数は1287人。
日本では1月25日に「国内3例目の感染確認 武漢からの旅行者」と報道があり、同日には厚生労働省から各都道府県などへの衛生主管部局へ「新型コロナウイルスに関連した感染症に係る外国語対応や支援ツールの周知等」という事務連絡が出されている。
その後、2月3日に横浜港に寄港したクルーズ船「ダイヤモンド・プリンセス号」が関心を高めたと思うが、1月29日に国内初の感染者が発見されわずか20日後に、12462人の感染症例/827人が死亡したイタリアなど、感染が世界へ拡大していくなか、2月17日に厚生労働省から「相談と受診の目安」、更に25日にも新たな方針が出されている。
3月11日に世界保健機関(WHO)は新型コロナウイルスの世界的な感染拡大について「パンデミック」を宣言。20日から22日までの連休のお花見で「大丈夫?」となり、3月末には営業時間の短縮などが始まった。


●4月の週刊予測投稿をまとめる

4月1日に、前述した3月27日の記事を読んだ後、東京都のサイトからCSVファイルをダウンロードし、試しに3月分だけを計算してみたのが始まり。その後、これまでの累計陽性者数に修正し、週刊化しようと4月5日(日)からFacebookへ投稿を始めた。※本投稿での数字は、fb時の入力ミスなどを修正しています

画像1

最初の投稿となった【3/29-4/4週】は、前週比2.34 累計比2.46であり、前週【3/22-28週】では、前週比4.61 累計比2.66であっため、週間比では下がったことが分かった。3月28日時点の累計陽性者数362件に、累計比2.66を掛けた予測は964件であったため4月4日の誤差は「-75件」、4月11日に「2183件」と予測した。
3月26日に東京都知事・小池百合子が20日から22日までの連休のお花見を受けた感染拡大を防ぐための自粛を訴えた最初の週末で、当時の報道にあった、ベッド数は足りるのか/軽症者は自宅療養でと対策に四苦八苦していた理由も自分なりには感じ取れた。

【4/5-11週】は、緊急事態宣言の発令(4月7日)とそれを受けた東京都の緊急事態措置の発表(4月10日)があった週だ。
4月11日(土)時点の累計陽性者数は1902件で、予測「2183件」からは「-282件」であり、前週比1.92 累計比2.14と、下降気味ではあるが、4月18日には予測「4065件」とほぼ倍加することには変わらなかった。
これにより、3月20日から22日の連休から数えて2週間が経ち、そこからもう一段陽性者が増えるのかという判断の分かれ目に出た緊急事態宣言は「気を抜かず対策する時期」と理解することができた。
しかし、武漢の都市封鎖が4月8日に解除されているが、当初思っていた収束はいつなのかという希望が感じられず、累計退院者数に死亡者含めた数字と累積陽性者数で割ることで「4.84%の陽性入院者が退院している」ということが分かり、半年くらい陽性者数がゼロになるまでかかると投稿している。

4月18日(土)にまとめた【4/12-18週】の累計陽性者数は2974件で、予測していた「4065件」から1091件も少なく、前週比1.06 累計比1.57 でコレまで続いてきた2に近い数字をどちらも割った。2週間前となる緊急事態宣言週(4/5-11週)の率で増加すると「4669件」であったため、緊急事態宣言発令下での社会の努力を少しは実感しはじめた。
アメリカでは、4月15日にカリフォルニア州知事が州の外出禁止令を解き経済活動を再開するための6つの指針を発表していたが、4月17日に感染者が71万人、死者は3万2000人を超えている状態で、全世界での収束は未だ見えない。

【4/19-25週】は、前週比0.803 累計比1.29 と2週連続で下降傾向を示し、予測「4653件」に対し817件少ない累計陽性者数3836件だった。この数字に1.29を掛けて予測「4948件」だが、この新型コロナウイルス感染症を2週間〜1ヶ月の動きで判断しようと考えていたため、先週よりは落ち着きを感じていた。

また、19日に東京都・小池知事の会見で、これまで変化の少なかった「退院(療養期間経過を含む)」件数が「退院者数は、各保健所から東京都に報告がされるものになっているが、コロナ相談や陽性者数が急増する中で保健所の業務も激増し、保健所から都への報告が届かなくなっていた」のを精査したことで急増した。
これによって、累計陽性者数3836件から、退院件数1070件を引いた「2766件」が現在の陽性者数ということと、「27.9%」が退院していることを知ることができた。

そして、本投稿の【4/26-5/2週】だ。
前週比0.74 累計比1.17 と3週連続の下降傾向で、特に前週より累計比が下がったことをポジティブに受け取っている。
また、死亡退院を含む累計退院者数は1691件で、5月2日時点の累計陽性者数4477件から引くと現在2786件が陽性者で、退院率は37.7%だ。先週から10%退院者率が上がっているが、これは先の件数報告の件もあるので考察するのはまだ後で良いかと考えている。

ここまで投稿してきた 前週比・累積比をグラフにしたのが下である。最初に示した累積陽性者数のグラフに週集計を合わせたグラフと横軸の日付が同じである。1.0を割ると、陽性者が増えないことになる。グラフの形状の違いから、後少しの努力に理解を持って協力できるのではないだろうか。

画像2

ここまで眺めてきたところで、現在発令下の緊急事態宣言が延期となるが、政府が言う「水泡に帰す」という理由は判った。経済活動についての方針も出るというが、ぜひとも医療現場の対応力の強化や公衆衛生講習(AEDを設置したように)なども含めて、今回「想定外」という言葉を聞かずにきているが、震災レベルでの意識向上を図ってもらいたい。


●終わりに

11年3月11日に起こった東日本大震災の時は、突如起こった目の前に見える事象があったから、それに対応することや応援もできたが、新型コロナウイルス感染症について目に見えるものは〈数字〉や耳に聞こえるのは〈うわさ〉だ。
症状についての解説、どこで集団感染が起こったとか、スーパーは三密だから、休業要請と補償、学校の再開、それ以前にあったオリンピックの延期、こういったことの全てを帰納するのは「いつまで続くのか」という問いかけで、恐らく誰も答えられないから同じような内容が繰り返し報道される、もうすっかり日々報道を観ることには疲れた。

ビッグデータを活用した参考データが盛んな今、こうやって数字だけにしてマクロに眺めることがデータドリブンということなのかな。また、データの受け取りだけではなく、商圏と住宅圏の近い池袋や吉祥寺のようなエリアでは一様に8割減といわれても達成しにくく、ヒュミント的な想像を加えたデータサイエンスも、これから始まるポストコロナ時代にますます必要になるのではないのではないかと、本投稿を締めておきます。

動きながら働きます