見出し画像

コロナウイルス統計メモ(2020.05)

自分の Facebook 投稿からコロナウイルスに関する統計やデータに関するものを転載。5月分は 67件ありました。(5/31更新)
◇ 2020.04 作成中
2020.05 公開中
2020.06 公開中

■2020.05.31 都市封鎖の厳格度インデクス

画像42

日経朝刊1面、データは語る「経済か収束か」より。各国の都市封鎖(ロックダウン)の厳しさが 0-100 で指数化されているが、これは英オクスフォード大学が日々更新している stringency index による。定性的なものを数値化することでこのような分析が可能になるのが面白い。日本は現在 40.74。
Covid-19 government response stringency index
https://www.bsg.ox.ac.uk/research/research-projects/coronavirus-government-response-tracker

>経済活動の制限と景況感の関係を調べるため、英オックスフォード大学の算出する都市封鎖の厳格度指数を用いて分析した。外出禁止や企業活動の制限など9つの指標をもとに厳格度をゼロから100の間で指数化。数値が大きいほど制限が厳しい。

👉 https://www.facebook.com/masashi.hagihara/posts/10222888266936555

■2020.05.31 陽性者数と感染者数とのずれ

画像41

昨日の東京新聞の記事がよくわからない。これだけいろんなデータ見てるのに(笑。毎日夕方に報道されているのは「感染者数(新規患者数)」で 5/7~5/28の累計は確かに 324人である。(今日は5人でしたね)

一方の「陽性者数」 486人のデータはどこだろ。毎日みんながヒトケタかどうかを気にしているレベルなのにズレでかすぎだが。実はモニタリング指標 (1) として「陽性者数」という項目がダッシュボードにあるのだが「感染者数」とまったく同じ数字になっているので、これではない。誰か教えて。

>両者の累計人数を見ると、陽性者数は感染者数より百六十二人も多い。数字上、これらの陽性者は「発表待ち」になっており、こうした状態は二週間以上続いている。https://www.tokyo-np.co.jp/article/32226

👉 https://www.facebook.com/masashi.hagihara/posts/10222886827060559

■2020.05.31 週末は新宿と池袋が混雑

画像40

リアルタイムモバイル空間統計でみると、本日16時台で赤い地点が2か所、新宿東口歌舞伎町周辺と池袋西口周辺で、500mメッシュで「25600人以上51200人未満」となっている(左)。東京ドームが 5万人なのでそこそこ入ってるようなイメージか。この2か所を含めて前年(右)と比べると1段階違うところが多いので半分程度というところか。

なお数字は地域ごとにドコモのシェアを計算式にいれた全体推計。例えばドコモのシェア 5割で実測が1万人なら2万人と推計されるはず(たぶん)

👉 https://www.facebook.com/masashi.hagihara/posts/10222886409450119

■2020.05.30 感染した日を推計する

この推定感染日の分布は、感染報告日の移動平均を2週間前倒ししただけのようだ。専門家の英知でもこんな単純な推定法を使うのなら、同じ方法を使って第2波の推定感染日を考えるしかないですね。推定感染日のピークは志村けんさん死去のタイミングと重なっており、ひとつのニュースが、緊急事態宣言よりも私たちの行動抑制に効いたということかもしれない。

👉 https://www.facebook.com/masashi.hagihara/posts/10222872824790511

■2020.05.30 空間統計学で感染を可視化

画像39

あいかわらずツイート等での物言いには腰が引けるものの、藤原かずえさんの計量分析アウトプットには期待しかない。データの欠損値を埋める空間統計学を使ったウイルス拡散分析、先日の関西版につづいて関東版が出た。23区と多摩でかなり違うなあ。

👉 https://www.facebook.com/masashi.hagihara/posts/10222871990929665

■2020.05.27 東京都の相談件数は減少せず 

画像38

ひさしぶりに東京都のデータみたら、毎日の感染者数より気になる指標がいくつか。例えば「受診相談窓口における相談件数」は、感染者数の減少とはうらはらに GW後もあまり減っていないようだ。キャパによるものなのか、症状が出ている人が減っていないのか。
https://stopcovid19.metro.tokyo.lg.jp/

👉 https://www.facebook.com/photo.php?fbid=10222847071786702

■2020.05.27 モバイル空間統計が無料公開

画像37

先ほどドコモの「モバイル空間統計」が一般公開されたと聞いて早速やってみた。リアルタイムおよび過去24時間のリプレイと前年を切り替えることができる(左が今日27日13時台、右が前年)。明日ウイズコロナ時代をどうデータで読むかという社内勉強会があるので資料を作っていたのだが、急遽加えることにした。これコロナ以外にも使えるよね。
https://xtrend.nikkei.com/atcl/contents/watch/00013/01020/

👉 https://www.facebook.com/masashi.hagihara/posts/10222845784674525

■2020.05.26 3月の人口動態統計速報発表

画像36

3月の人口動態統計速報でました。3月の死亡者数は全国 119,161人(前年同月119,329人 0.1%減)、東京 10,546人(前年同月10,488人 0.5%増)、コロナが原因と思われる海外のような超過死亡はたぶんありません。

👉 https://www.facebook.com/masashi.hagihara/posts/10222835715382799

■2020.05.26 中南米の感染者数が拡大

画像35

日本は宣言が解除されても、世界はまだこれから未知領域の可能性。収束期の欧州4カ国+拡大期の中南米4カ国+日本、3月中旬以降の新規感染者数(7日移動平均、対数スケール)をグラフ化。欧州よりも中南米はよりゆっくりでより大きな波にみえて不気味だ。OWINで作成。

👉 https://www.facebook.com/masashi.hagihara/posts/10222828195434805

■2020.05.25 3月の人口動態調査に注目

超過死亡の有無については、今日明日中にも厚生労働省から3月分の人口動態統計速報(死亡届枚数ベース)が出るはずなのでそれで判断すればよいと思う。(2月分は 4/24に発表されてます)
https://www.mhlw.go.jp/toukei/list/81-1a.html

👉 https://www.facebook.com/masashi.hagihara/posts/10222823253071249

■2020.05.25 間が悪い日経の取材記事

画像34

日経、間が悪すぎる。昨晩書いたように国立感染症研究所のこのグラフは昨日(5/24)更新されて「超過死亡200人以上」というこの記事や見出しの根拠が消滅しているのだ。日経は感染研に取材までしているのに、なぜ昨日の更新を知らなかったのだろう。ともあれ多くの読者は感染研ソースにあたらんだろうし、見出しだけみて大騒ぎになるのは必至だ。

👉 https://www.facebook.com/masashi.hagihara/posts/10222822766659089

■2020.05.24 日本に超過死亡は起きたか

画像33

日本の「超過死亡」を推測するのに役立つのではないかと期待されていた国立感染症研究センターの「インフルエンザ関連死亡迅速把握システム」が今日更新されたのに、1) いまだ14週以降(4月以降)のデータが追加されない一方で、2) データが過去に遡って修正されてたり(2月が増え3月が減少、大幅な閾値越えが消滅)、3) Y軸スケールが 140→300にいきなり変わってたり、いろいろと意味不明である。ほんと日本の統計って。
https://www.niid.go.jp/niid/ja/flu-m/2112-idsc/jinsoku/1852-flu-jinsoku-7.html

👉 https://www.facebook.com/masashi.hagihara/posts/10222816440020927

■2020.05.24 NTY紙が死亡者の名前を掲載

24日のニューヨークタイムズ紙日曜版フロントページは、新型コロナウイルスで亡くなった方の名前、年齢、居住地、仕事で埋め尽くされた。それでも10万人のうち1000人のみと。統計数字ではなくひとりひとりの人生であることに心を打たれるが、日本の新聞で同じことは難しいだろう。

👉 https://www.facebook.com/masashi.hagihara/posts/10222814540253434

■2020.05.23 イタリアの死亡超過数

一般死者数統計からの推計(超過死亡)をイタリア当局自身が発表。やはりあの混乱の中で死者数を把握するのは困難だったようだ。分析をするにしても正確な統計がそろうのは来年以降になるのかもしれない。

>政府がおよそ2万8000人と発表しているこの2か月間の新型コロナウイルスによる死者数は、実際にはさらに1万9000人近く多い可能性があるとしています。

👉 https://www.facebook.com/masashi.hagihara/posts/10222804224475546

■2020.05.23 南米で感染拡大の兆し

画像32

Financial Times のダッシュボードが、一対比較から多国比較表示も可能になっていたので「いま注視しとくべき国」を選んで表示させてみた。ブラジル、ロシア、インド(BRICs)に加えてチリとペルーが急増中、次の流行の中心は南米になるのは確実。あとイランが第2波。対数スケールによる。

結局日本が収まっても、グローバルでみればまだまだ流行は続きそうな気がする。アフリカも心配だ。結果的に国の間の移動は収まった国でも今年中は難しいのではないか。オリンピックにも影響するよね.....

👉 https://www.facebook.com/masashi.hagihara/posts/10222801907097613

■2020.05.21 10万人あたり0.5人ライン

トラジェクトリー2

今晩の法政大の授業ではトラジェクトリー(弾道)解析グラフもとりあげた。札幌医科大のインタラクティブツールを使って、8都道府県のデータ(5/20時点)を描くと、もともとY軸は100万人あたり1週間の新規感染者数なので、緊急事態宣言解除の基準(10万人あたり0.5人)にも使えるのだ。このグラフだと目標が可視化されるので「よし落ちてる!」とか「もう少しだ!」という気持ちになれる、もちろん第2波の兆しもすぐにわかる。と何度も書いてるけど相変わらず見ないな。なんでやろ。

👉 https://www.facebook.com/masashi.hagihara/posts/10222785182599511

■2020.05.21 ハムスターでマスク効果測定 

画像30

夕方のニュースで、ハムスターにマスクをすると感染率が下がるという香港大学の研究結果を紹介していたが、この 66.7%、33.3%、16.7% がどうしても気になる。リサーチャーなら頭の中でアラートがなる数字なのだ。まさか6匹中、4匹、2匹、1匹ではなかろうな(笑。小数点1位まで出すなら少なくとも数百匹でないと。<18:10追記>10/15=66.7%、4/12=33.3%。2/12=16.7%でした。どうなんですかねこれ。
https://www.scmp.com/news/hong-kong/health-environment/article/3084779/coronavirus-hamster-research-proof-effectiveness

👉 https://www.facebook.com/masashi.hagihara/posts/10222783795844843

■2020.05.21 東京都がまた計上ミス 

おはよう日本より。東京都が先週は76人の計上漏れ、今日は40人の計上漏れ。緊急事態宣言解除基準の「10万人あたり0.5人」というのは、東京都1400万人として1週間あたり70人の攻防だ。基準を決めても元のデータがそんなにズレるのならアホすぎる。「今月上旬までのデータだから判断に影響を与えない」とあるけど2度あることは3度あるからな。

👉 https://www.facebook.com/masashi.hagihara/posts/10222779832745768

■2020.05.20 Worldometer に注意(3)

画像29

先ほどのCNN記事には「ワールドメーター Worldometer の信頼性に疑問」という動画のニュースクリップもありました。元記事→
https://edition.cnn.com/interactive/2020/05/world/worldometer-coronavirus-mystery/

👉 https://www.facebook.com/masashi.hagihara/posts/10222770933203285

■2020.05.20 Worldometer に注意(2)

やはり「ワールドメーター worldometer」は使わない方が無難だ。「COVID-19がひとつのミステリアスなデータサイトを有名にし、世界に混乱の種をまいている」というCNNの長文記事。上海の Dadax という会社と関係はありそうだが、CNNが調べても運用実態がわからないという。

オックスフォード大(Our World in Data)も「ソースが正しいかどうかより、とにかく早くデータを集めることに注力している」と回答。一方で政治的利用(スペイン政府による検査数ランキングの引用)なども生んでいる。驚くのは、ジョンズ・ホプキンス大学もクローリングソースとして使うことがあり、データ速報のプレッシャーがあるのだという。
The coronavirus pandemic catapulted Worldometer to prominence, but its inner workings are still a mystery

👉 https://www.facebook.com/masashi.hagihara/posts/10222770817160384

■2020.05.20 Worldometer に注意(1)

画像28

日経朝刊。横道ですがデータの出所が「ワールドメーター Worldometer」になっているのが残念。数字は正しいと思いますが、広告だらけで運用元の実態がよくわからないサイトなんです。感染拡大初期には情報が早く便利だったので私も見ていましたが、国別の100万人当たり死亡者数なら、WHO でもジョンズ・ホブキンス大学でもオクスフォード大学でも簡単に見つかるので、新聞で引用するならそちらの方が(笑
サイトはこちら→ https://www.worldometers.info/

👉 https://www.facebook.com/masashi.hagihara/posts/10222770517072882

■2020.05.19 政府が「K値」の利用を検討

日経朝刊、政府が「K値」を感染状況の把握に使うとの記事。提唱した阪大の中野教授は「K=0.05 が緊急事態宣言解除の目安」と主張しているが、東京ですらすでに K=0.042(5/16時点)で解除基準を下回っている。

K=0.05は 1週間の新規感染者数が「10万人あたり1.7人」という水準だそうだ。現実には政府の方針はもっと厳しい「10万人あたり0.5人以下」が目安になった。とすれば「K値」は不要、ほかどこで使うのかしら。

👉 https://www.facebook.com/masashi.hagihara/posts/10222764899252440

■2020.05.19 コロナ感染マップ関西版

藤原かずえさんの計量分析アウトプットの面白さに畏敬の念を抱く一方、アゴラや月刊Hanada での容赦ない個人への罵倒から受ける印象との間で、気持ちの置き場に困る(笑 空間統計学とは初めて聞くがマーケティングリサーチでも使われる欠測値処理のようなものか。

>実は私にはちょっとだけ【空間統計学 spatial statistics】の知識とスキルがあります。何を隠そう、特定の空間地点におけるデータから、データが得られていない任意の地点のデータを確率統計学的に推定するという浮世離れした計算が結構得意なんです(笑)

👉 https://www.facebook.com/masashi.hagihara/posts/10222761226000611

■2020.05.18 OWINのデータ分析ツール

英オクスフォード大が運用する「Our World In Data (OWID)」に、コロナウイルス統計関連では最強クラスのインタラクティブツールが公開されたので紹介しておく。人口あたりや移動平均など痒いところに手が届くオプションに加えて、グラフデザインの細部が素晴らしいのだ。作成グラフの画像化とシェア、CSVでのデータダウンロードも可。10分くらいいじると神髄が見えると思うのでお試し下さい。もう私はこれでいいです。

👉 https://www.facebook.com/masashi.hagihara/posts/10222755219290447

■2020.05.18 1-3月期GDPは年率3.4%減

意外に減少幅が少ない。オリンピック延期決定が 3/24、緊急事態宣言が 3/27なので、ガチに影響でるのは 4-6月期なのだろう。
10-12月期 速報▲1.6%(年率▲6.3%)改定値▲1.8%(年率▲7.1%減)
1-3月期 速報▲0.9%(年率▲3.4%)

👉 https://www.facebook.com/masashi.hagihara/posts/10222750230805738

■2020.05.17 コロナ後の内閣支持率

今週末は朝日新聞とANNの世論調査(系列だが調査は独立)、大幅な変動があった。安倍内閣支持率は、ネタを問わず与野党が紛糾・対立するタイミングで下がる傾向がある。緊急事態宣言の緩和などの評価は高く、国民センチメントも改善方向に向かっているので、コロナ対策の不手際だけでこれほど下がる理由はない。むしろ検察庁法改正が効いているのではないか。

👉 https://www.facebook.com/masashi.hagihara/posts/10222750071001743

■2020.05.17 怒りツイートは拡散しやすい

画像27

NHKスペシャルより。ソーシャルリスニングにやはりセンチメント分析は欠かせない。哀怒昂恥怖安驚喜厭好の10感情で最も拡散するのは怒。

👉 https://www.facebook.com/masashi.hagihara/posts/10222743525598112

■2020.05.16 BRICs が次の流行地なのか

画像26

毎日の報道をみるかぎり、いま世界で最もやばいのは、ブラジル、ロシア、インドなのだが、この顔ぶれは偶然にも BRICs ではないか。中国の第1波、欧米の第2波、そしてこれらが第3波の主役になろうとしているわけだ。グラフは7日移動平均による新規感染者数(線形スケール)。真ん中の3本はイタリア、スペイン、ドイツだがその山より高い。OWID で作成。

👉 https://www.facebook.com/masashi.hagihara/posts/10222729040155985

■2020.05.16 米国賃金はなぜ上がったのか

失業率

米ワシントンポスト紙より。4月の米国労働者平均賃金が前年同月比で爆上げした恐ろしい理由。低賃金の労働者ほど大量に失業し統計にカウントされなくなったためであり、実際に賃金が上がったわけではない。記事内に賃金水準別失業率データあり。平均という指標の落とし穴。

>The awful reason wages appeared to soar in the middle of a pandemic
https://www.washingtonpost.com/business/2020/05/08/awful-reason-wages-appeared-soar-middle-pandemic/

👉 https://www.facebook.com/masashi.hagihara/posts/10222726233325816

■2020.05.15 抗体検査結果を正しく読む

画像24

報道ステーション、無作為抽出でもなく、偽陽性の可能性も高いと伝えていながら、わずか 500人中 3人=0.6%という数字を使い、拡大推計して東京都の感染者 8.3万人で16倍の可能性とか言ってはダメだろう。統計学のほんの表面しかわかっていないというか、間違った使い方だ

👉 https://www.facebook.com/masashi.hagihara/posts/10222720062851558

■2020.05.15 消費者マインドは好転か

今回も必見。マクロミルのウィークリー定点観測データを使った分析、コロナ関連では3回目のレポート。7つの図表が掲載されていますが、どれもインパクトがあります。前回(4月中旬)のレポートではどの指標もかつてないほど、消費者の意識も行動も悲観的状況でしたが、5月に入ってマインドだけでなく消費も回復の兆しが出てますね。

👉 https://www.facebook.com/masashi.hagihara/posts/10222718463171567

■2020.05.15 感染者数グラフの読み方

オクスフォード大学 OWID より。トラジェクトリー・チャートの読み方解説動画(約4分)、多くのメディアが当たり前のようにこのグラフを使うようになったので、普通の人たちに基本を伝えることが重要なのだろう。こうした海外のチュートリアルビデオは本当にセンスがよい。大絶賛。

👉 https://www.facebook.com/masashi.hagihara/posts/10222717193179818

■2020.05.15 母集団推計をしてはならぬ 

他の報道をあわせ読むと、複数のキットで結果はばらつき、0.6%も500件中「最大3件」の数字だ。こうした母集団推計はやってはいけない。比較のための1年以上前の保存検体でも「最大2件(0.4%)」出たそうだ。これらの結果から抗体保有率が多い少ないという議論は意味なさそう。

>東京都の人口推計(1398万人)に基づき計算した場合、約8万3880人が感染しており、検査時に東京都が公表していた感染者数の約18倍が感染している計算になる。

👉 https://www.facebook.com/masashi.hagihara/posts/10222716977414424

■2020.05.15 消費者意識と行動の変化

ESOMAR "Research World" 誌より。Nielsen、Kantar、IPSOS、GfK、YouGov、Dynata、Toluna など世界中の調査会社が実施しているコロナウイルス関連の消費者意識調査リンク集とサマリ、定点調査も多い。こういうとき日本の調査会社が出ないのは寂しいが、とりあえず超保存版。次の社内定例会議でもレポートしたい。

👉 https://www.facebook.com/masashi.hagihara/posts/10222716129393224

■2020.05.14 東京都で超過死亡は起きたか

画像23

隠れコロナ死者数を推計するための「超過死亡」が確認できる厚労省の3月人口動態統計は今月下旬発表だが、ひとあし早く東京都の死者数統計が出て、早野教授がグラフ化されている。3月は過去5年平均のエラーバー(1標準偏差)をわずかに上回るが逆に2月は下回っていて、ニューヨークやロンドンのような大幅な超過死亡は起きていないとみて良さそう。
https://twitter.com/hayano/status/1260025720807452674

👉 https://www.facebook.com/masashi.hagihara/posts/10222706788639711

■2020.05.14 弾道グラフで収束を読む

画像21

画像22

変数としての「K値」はひとつの数字で収束レベルを表せるので、後日、拡大や収束がどんな説明変数で起こったかを分析するには良いと思う。でも私たちがいま直感的に収束を実感できるのはトラジェクトリー解析(弾道図)だ。複数県で3月連休後の「第二波」がくっきりわかるのも凄いが、なにより美しいのが好きだ。都道府県別感染者数実数(左)と100万人あたり(右)による、札幌医科大学サイトより。

👉 https://www.facebook.com/masashi.hagihara/posts/10222705425605636

■2020.05.13 4月の景気ウォッチャー調査

内閣府から4月の景気ウォッチャー(街角景気)調査結果が公表された。超リアルなので読む価値があるぞ。具体的な数字もかなり入っている。定量指標である景気 DI が過去最低となったのは当然だろうし、個別の対象者コメント(定性情報)は、外食、旅行、レジャーなどは確かにどん底なのだが、小売については好調なところもあり、まだら模様ともいえる。

👉 https://www.facebook.com/masashi.hagihara/posts/10222698145583640

■2020.05.13 ロックダウンレベルの指標化

画像20

今日も FT の冴えわたるデータビジュアル記事を紹介。各国のロックダウンレベル(厳しさ)を、0-100 でインデクス化、6段階に色分けしてアニメーションと国別の対策レベルの変化を地図とチャートで表現している。

データは Oxford University Blavatnik School of Government より。学校、商業施設をどの程度閉鎖しているか、移動はどの程度可能かなどレベルごとに細かく点数基準を決めその合計スコアを算出。異なる国の異なる施策を客観的に比較可能にする試みで、この数量化の仕組み自体が勉強する価値あり。私自身はまだ読んでないけど(笑

Exiting lockdowns: tracking governments’ changing coronavirus responses
https://ig.ft.com/coronavirus-lockdowns/

👉 https://www.facebook.com/masashi.hagihara/posts/10222696384699619

■2020.05.13 松本健太郎さんの視点

日経ビジネスより。さすが 松本 健太郎 さんの視点は鋭いところを突いている。この3か月、国内外のデータを追いかけてきて思うのは、公的統計でも間違うし、ソース間の整合性がとれていないケースが多いということ。そして修正や訂正の伝え方や対応がダメならば、国や発表元への信頼感が損なわれるということ。コロナ関連データはリアルタイムだけに本当に難しい。

👉 https://www.facebook.com/masashi.hagihara/posts/10222696328218207

■2020.05.13 4月の自殺者数が20%減少

自殺者数2

4月の自殺者数は前年同月比20%減(1814人→1455人)、意外で驚いたが朗報だ。自殺者数は年々減少しているので、警察庁のデータで5年分をグラフ化してみたが、やはり4月の減少幅は特に大きい。仮説としては、経済的な悪影響以上に人間関係への好影響が出たということか。また連日の報道で「苦しいのは自分だけ」という孤立感は少なくなったかもしれない。

>新型コロナウイルスの感染拡大の影響で、家族ら同居する人が外出せず家にいることや、職場や学校に行く機会が減り、悩むことが少なかったことなどが要因とみられています。(TBSニュース)
https://news.tbs.co.jp/newseye/tbs_newseye3977832.htm

👉 https://www.facebook.com/masashi.hagihara/posts/10222695136988427

■2020.05.12 定点観測でみる消費の変化

マクロミルのウィークリー定点観測データ(Macromill Weekly Index)が日経夕刊1面に!今回は消費動向。家での特別な食事は正月に跳ね上がりますが、今年はGWにも上昇、外食費は劇的に低下してます。全国対象。

👉 https://www.facebook.com/masashi.hagihara/posts/10222687033945856

■2020.05.12 中南米で死者数が増加中

画像18

役に立たない WHO 日報ウォッチを止め、FT や OWID を確認するのは精神的にも良いのだが、今日の FT で気になったのは、ブラジルを含む中南米での死者数増加とシェア急増である。7日移動平均実数データ(上の面グラフ)では目立たないが、日次シェアデータ(下の帯グラフ)では北米と欧州に並んでしまった。バトンを渡すようにアジア→欧米→ラテンと感染中心地が移動している。またアフリカがいまだ数字に出てこないのも不気味だ。

👉 https://www.facebook.com/masashi.hagihara/posts/10222686218885480

■2020.05.12 厚労省のデータ管理システム

今朝の日経総合面。自治体ホームページからのデータ収集はさすがにダサいので、都道府県→厚労省のデータ一元管理の話かと思ったら違った。医療機関や感染者本人がクラウドにデータ入力し、それを保健所、都道府県、厚労省が共有、利用する仕組みらしい。ローデータを「自主的に」入れてもれっても網羅性がなく一元管理とは言えない。何かの誤解ではないのか。

>医療機関や感染者が自らスマートフォンやパソコンでPCR検査の結果や症状、行動歴を入力し、関係機関がクラウド上で共有する。

👉 https://www.facebook.com/masashi.hagihara/posts/10222685458146462

■2020.05.11 都の感染者数集計で報告漏れ

>端末に入力したものを改めて手で書き写して報告するなど煩雑な事務作業も一因だったとみている。/小池百合子知事はこの日、感染者の情報を一元的に管理するデータセンターの設置を明らかにした。

統計の責任者(chief statistics officer)みたいな人がいればまず考えるのはデータのロジスティクスである。リサーチャーには当たり前だ。きちんとしたデータ収集の仕組みがあって初めてデータ精度は担保される。クラウドにフォームを置いて入力してもらうとか検討しないのかな。

保健所が忙しすぎるという同情もあり、私もその側面はあるとは思う。ただ昨年の勤労統計不正問題も、結局は担当者が忙しすぎてオーバーフローを起こしたのが遠因で、直接間接の損害は計り知れない。現場がまわらなければ、まわすための手立てや仕組みを考えるのが組織のトップだろう。遅すぎる気もするが、一元管理のためのデータセンターの設置は当然だ。

そういえば昨日は、厚労省に都道府県から報告が届かず、厚労省が自治体のホームページから収集することにしたという報道もあった。コロナデータに関しては、日本のロジスティクスはズダボロである。

👉 https://www.facebook.com/masashi.hagihara/posts/10222677416505426

■2020.05.11 「K値」で収束を測る(3)

画像17

引き続き「トラジェクトリー解析」と「K値」の関係について。日本とドイツについて、K=0.5前後、K=0.25前後、最新(5/10)をプロットしてみた。やはり「K値」とは弾道の位置を示すものであることがわかる。ドイツは日本の約10倍の感染者がいますが「形」は同じです。

👉 https://www.facebook.com/masashi.hagihara/posts/10222673888657232

■2020.05.10 「K値」で収束を測る(2)

画像16

逆に「トラジェクトリー解析」からみた「K値」について。

K値=過去1週間の新規感染者数(Y軸)/累計感染者数(X軸)

なので、例えば日本(5/9 時点)は、K=1092/15663=0.070 です。K=0(終息)とは、弾道(トラジェクトリー)がx軸に着弾するのと同じで、分母の数字に関わらず分子=0 になったときです。K値が国による感染者数の規模にかかわらず使えるのもそのため。また K値のトレンドの角度が変わるのは弾道の傾きの変動(これまでドロップと表現)にあたります。そういう理解でいいかしら。どなたかご助言下さい。
https://aatishb.com/covidtrends/

👉 https://www.facebook.com/masashi.hagihara/posts/10222663453476359

■2020.05.10 「K値」で収束を測る(1)

感染の拡大収束をみる話題の「K値」というのは例の「トラジェクトリー解析」と同じ2変数のみ、つまり「累計感染者数(X)」と「1週間前の累計感染者数(Y)または過去1週間の新規感染者数(X-Y)」を使う点でほぼ同じ考え方であることに感動。どちらもわかりやすいはずだ。グラフの弾道でみるか比率の変化でみるかの違いですよね。
・X=累計感染者数
・Y=1週間前の累計感染者数
・K=(X-Y)/X=1-Y/X

👉 https://www.facebook.com/masashi.hagihara/posts/10222663237710965

■2020.05.10 各国リーダーの支持率(2)

画像15

夕方シェアした英 Economist の記事、サムネイルだとわけがわからないのだが、データ加工の仕方やグラフのデザイン、詰め込まれている情報量の豊かさなど、興味深い技法や Tips の塊だと気付いたのでキャプチャでシェアしておく。なぜ見やすいのか考えると良いぞ。安倍ちゃんの支持率が低いからシェアしたわけではないので念のため(笑

👉 https://www.facebook.com/masashi.hagihara/posts/10222662038720991

■2020.05.10 各国リーダーの支持率(1)

英エコノミスト誌より。WHOのパンデミック宣言(3/11)以降、各国リーダーの2か月間の支持スコア(支持から不支持を引いたもの)増減の推移。多くの国で支持率は着実に上がっていて、上から、Morrison (64%)、Trudeau (61%)、Merkel (58%)、Johnson (61%)。

安倍首相は支持スコアそのものも低く(28%)さらに下落中。ロックダウンの厳しさとか死者数とか関係ないようで、これは実績や政策というより信頼とか感情の問題としか思えない。データは Morning Consult、15か国で「毎日」支持率調査を行い7日移動平均で発表している。

👉 https://www.facebook.com/masashi.hagihara/posts/10222660217715467

■2020.05.10 厚労省が統計を大幅修正

東京都の死亡者を「19人」から「171人」に大幅修正。自治体が厚労省の報告依頼を無視してたってことか。ホームページから集めるなら個人でもできるやん。いろいろと情けない。国内メディアはこれまでも自治体からデータとっていたので影響はないが、問題は厚労省からデータを取ってる海外メディアや国際機関への影響。

>3月下旬以降、感染者が急増した都道府県から詳しい情報が報告されず、実態と合わなくなっているため、9日から都道府県がホームページで公表する情報を集計する方法に改めました。

👉 https://www.facebook.com/masashi.hagihara/posts/10222659184569639

■2020.05.09 経済支援の手厚い国はどこ

国際比較調査その3、各国の経済支援額をランキング。どうせ日本は低いだろうと思ったら驚きの2位、最も経済支援が手厚い国と評価されている。と思ったら安倍さんの発表した 108兆円で計算してるやん。財政支出(真水)なら39兆円とも25兆円ともいわれ最下位なのだが。

>最も積極的な対応のひとつが日本政府が打ち出した、同国の国内総生産(GDP)の約2割にあたる108兆円規模の政策パッケージだ(日本を上回っているのは、欧州連合の基金からの利益を受けるマルタのみ)。

👉 https://www.facebook.com/masashi.hagihara/posts/10222644376199439

■2020.05.09 日本はまだ悪い状況と悲観的

国際比較調査その2。ボストンコンサルティングによる。4月中旬だと日本はまだ感染拡大ピークにあり、政府や自治体が厳しい状況というメッセージを強く発信していたのでそういう認識は当然だろう。他国の調査はその翌週、1週間でも状況はずいぶん変わる。コロナ調査は調査時期に注意。

>日本は感染状況や景気の落ち込みについて「最悪の状態は脱していない」との回答が82%にのぼった。

👉 https://www.facebook.com/masashi.hagihara/posts/10222644251036310

■2020.05.09 各国リーダーの対応評価

時事通信より。自国政府のコロナ対策評価に関する国際比較調査。同様の調査でも日本人の政府対応評価は他国に比べておおむね低いのだが、この5%はさすがに低すぎるぞ。1位中国 86%も含め参考程度ということで。ところで、ブラックボックスリサーチ社とは初めて聞いたが、透明性が必要とされるリサーチ会社の名前いいのかそれで(笑

>日本で安倍政権の対応を高く評価した人の割合は全体の5%にとどまり、中国(86%)、ベトナム(82%)、ニュージーランド(67%)などに大きく劣った。

👉 https://www.facebook.com/masashi.hagihara/posts/10222644190354793

■2020.05.08 東京都「陽性率」の計算方法

重要な情報(集計方法)がたくさん出ているので、統計セクタはチェック必須。陽性率は「7日移動平均」による検査人数と感染者数で算出ですね。(早く言ってくれ)

>都は、その日までの1週間に陽性と判明した人数の平均を、その日までの1週間に検査した人数の平均で割って「陽性率」を算出しています。たとえば、7日の「陽性率」は、5月1日から7日までの1週間に陽性と判明した人の平均である22人を、同じ期間に検査した人の平均292人で割って、7.5%と算出したということです。

👉 https://www.facebook.com/masashi.hagihara/posts/10222637386784708

■2020.05.08 何が売れて何が売れないか

画像13

画像14

>コロナで「売れた」「売れなくなった」商品TOP30(東洋経済)
https://toyokeizai.net/articles/-/349029
どちらもマツキヨにありそうな商品ばかりだが、前年比は劇的に明暗が分かれる。女子たちはどんだけ化粧しなくなってるんだよ(笑。地味なデータだけど理由を考えながら眺めればマーケティング感覚を磨くのによさげ。インテージ SRI (全国小売店パネル調査)より。

👉 https://www.facebook.com/masashi.hagihara/posts/10222636865971688

■2020.05.08 消費と気分に回復の兆し

画像10

画像11

画像12

これは凄い。マクロミルのウィークリー定点観測が、Tableau プラットフォームに移行、表示期間指定や地域・性・年齢によるフィルタリングが可能になり、毎週水曜に実施する調査結果を金曜午前公開へ大幅スピードアップ。おととい実施(5/6)調査では、消費意欲の回復やセンチメント改善を読み取ることができます。気のゆるみでないと良いのですが。
https://www.macromill.com/data_and_insights/weeklyindex/

2013年からデータあり。このインデクスについて詳しく知りたい場合は 村上 智章 さんへ。なお、コロナ後の変化を見やすくするため、キャプチャにマクロミル総研所長が勝手に補助線(2月1週)を引いておきました(笑

👉 https://www.facebook.com/masashi.hagihara/posts/10222632739428527

■2020.05.07 我々はいまどこにいるのか

画像8

画像7

100万人あたり感染者数を韓国と日本で比較すると、例の概念図そのものだ。3月の拡大期に韓国を真似ず、医療提供キャパを超えないことを重視し、ピークを遅らせ山を下げるのが日本の戦略だったから、収束が遅く自粛期間が延びるのは想定内だろう。疫学的には対策成功ということでは。自粛長期化による経済的な影響は別として。(12:45追記:コメントからのいまここ矢印追加)

👉 https://www.facebook.com/masashi.hagihara/posts/10222621730713316

■2020.05.07 FT の新チャートは優れもの

画像2

Coronavirus tracked: has your country’s epidemic peaked?
https://ig.ft.com/coronavirus-chart/

FT のデータビジュアライズが、さらに使いやすく見やすくなっている。国選択、項目選択、指標選択、グラフ選択などベーシックなのだけど、なぜか UI が快適なのだ。実数だけでなく100万人あたりの人数などデータセットも痒いところに手が届く。アイディアを出すデザイナーとそれを形にするエンジニアのタッグが絶妙なのだろう。弟子入りしたいくらいです。

👉 https://www.facebook.com/masashi.hagihara/posts/10222620684047150

■2020.05.06 「超過死亡」とは何か

画像9

話題の記事。私も「超過死亡」(平年比でどれだけ一般死亡者が増えたかによってコロナによる実際の死亡者数を推計する方法)アプローチは実態把握に最有力と思っているので、疑問や仮説をコメント欄に書き込んだところ丁寧な対応をいただいた。人口動態統計が出るのはまだ先で、日本の実態把握に感染研の「インフルエンザ関連死亡迅速把握システム」は注目すべきだが、東京が不気味だ。ぜひコメント欄も含めて読んでみてほしい。

👉 https://www.facebook.com/masashi.hagihara/posts/10222612822530617

■2020.05.06 日本を欧州に置いてみると

画像4

同縮尺の日本と欧州、思ったより日本は広い。日本の地方別分析は欧州の国別分析のようなものかもしれない。感染状況の違いもわかるし、自治体で対応の違いがあっても当然だろうと思えてくる。(今朝どこかでそういう趣旨の投稿を見かけたけど思い出せないので、地図を https://thetruesize.com/ で作成しました。これ面白いですよ、メルカトルの歪もよくわかる)

👉 https://www.facebook.com/masashi.hagihara/posts/10222608190254813

■2020.05.05 東京都の陽性患者数(5/5)

画像5

5/5 東京 58人、二日連続3ケタとか三日連続2ケタとかいう報道の言い回しに意味はない。連休中も保健所や病院や都庁は動いているようだし、検査の実施、判明、集計には数日のラグがある。凸凹を均せばこんな山になるのだ。(過学習気味の数式だが予測ではなくトレンド確認なのでよいかと)

👉 https://www.facebook.com/masashi.hagihara/posts/10222599189229793

■2020.05.05 米新規死亡者数がマイナスに

画像9

WHO日報、やっぱりというか、案の定というか、これはないだろー。

現在米国の死者数は1日 2000人前後で推移しているが、昨日 5000 ちょうどに激増していた。ところが今日はマイナス(-1696)である。たぶん昨日、仮の数字(5000)を入れておいてあとから正確な数字にしようと思っていたけど忘れてしまい、そのまま集計して出したのだろう。世界全体の統計にも影響している。杜撰。ともあれ米国の死者数は2日間で 5000-1696=3304人(1652人/日)と推測される。ちなみに注記やお詫びは見当たらない。

👉 https://www.facebook.com/masashi.hagihara/posts/10222596860131567

■2020.05.05 データと事実から導く政策

サブタイトル「データと事実から導き出される合理的な政策」が、何度か書いてるけど帰納的アプローチなんです。疫学理論からの演繹的アプローチでは現実とのズレが出てしまう。どちらも「正しい」科学的手法ではあるのですが、未知の現象に対しては帰納法を取り入れて修正、適応すべきで、専門家は既存理論やモデルにこだわりすぎではなかろうか。(ただ専門家は理論に精通しているからこそ専門家という側面もあるので、難しいところではありますね)

👉 https://www.facebook.com/masashi.hagihara/posts/10222590036160972

■2020.05.05 基本再生産数と実効再生産数 

ちょっと見出しにひっかかって本文も読んだんだけど、これ各ウイルスが本来持っている感染力指標である「基本再生産数」(R0)ではなく、感染者の増加、減少で日々変動する「実効再生産数」(Rt)の間違いではないのか。でもロイターだからな、まさかなあ(と言ってみる)

>「基本再生産数」は平均0.6─0.7と、これまでの0.5からやや上昇した/基本再生産数が0.7であると、感染者100人が新たに感染を広げるのは70人にとどまることを意味し、1を下回れば流行は終息に向かっていることを示す

👉 https://www.facebook.com/masashi.hagihara/posts/10222589857476505

■2020.05.02 国別にみる終息日予測

画像10

シンガポール工科設計大学による国別の終息予測、研究用という断りはありますがデータと予測を毎日更新。これなんですよね、日本の専門家会議にもやってほしいのは。感染学の数理モデルと仮定による演繹的見通しではなく、現実データから帰納的にモデルを作り日々更新、予測して対策を打つ。

でもね、世界全体での「完全終息」予測は 12月7日。米国 9月21日、シンガポール 6月5日など、26か国の分析があるが残念ながら日本の予測はない。元になる感染者数データがプア(量不足か低品質)だからだそうだ。我々はデータなしで戦うのか。セルビアやバングラデシュですらあるのに。
https://ddi.sutd.edu.sg/when-will-covid-19-end

<5/2追記>5/2付で日本の予測が追加されてました。

👉 https://www.facebook.com/masashi.hagihara/posts/10222556294997464

■2020.05.02 渋谷の接触率は減少したか

>西浦さんは、「都心への通勤を続ける限りは、(強制ではない)自粛要請のレベルでは限界があることがわかった」などと語った。

昨日、渋谷駅周辺は閑散だが少し離れると飲食店もやっていて人通りも多かったと写真付きで投稿しました。たまたま昨日の専門家会議の報告書に、渋谷周辺の接触率減少を推計した図表が載ってまして、この朝日記事のサムネイルは先週金曜(4/24)昼時の減少率。「通勤続く限り、8割減無理」はその通りだと思います。みんな「知ってた」との反応ですが。

👉 https://www.facebook.com/masashi.hagihara/posts/10222539041886147

■2020.05.01 東京都の陽性患者数(5/1)

画像8

東京が165人だそうだが、移動平均でも近似曲線でもダウントレンドに変わりはない。ニュースで言ってる何日ぶりの三ケタとか、前の日の何倍とかにはあまり意味はないので、一喜一憂せずトレンドと数式を信じるのだ。

👉 https://www.facebook.com/masashi.hagihara/posts/10222547145408730




この記事が気に入ったらサポートをしてみませんか?