COVID-19の分析

DATA Saber Boot Campでのコミュニティ活動課題であるCOVID-19の分析をしてみました。
そもそもデータも指定されたチャートも何もないゼロからのスタートであったため内心震えておりました...
とりあえず進め方を以下のようにして、スタートしてみました。
1.分析テーマの決定
2.データの収集
3.分析・インサイト

1.分析対象の決定
何を分析してみるかを決めるため、COVID-19にかかわるワードを挙げられるだけ挙げてみました。

①クラスター
 →医療施設、福祉施設でのクラスター
②高齢者、基礎疾患持ちの患者の死亡率増加
 →感染しても無症状の人がいるらしい
③マスク、ティッシュ、消毒液、ハンドソープの不足
 →一部のSNSでのデマ、
④非常事態宣言
⑤不要不急の外出自粛
⑥テレワーク
⑦おうち時間増加
 →あつもりブーム?
⑧学校の休校
⑨給食取り扱い農家による廃棄
⑩Zoom飲み会、Zoom人狼ゲーム?
などなど。

この中で特に興味を持ったのが、⑤不要不急の外出自粛です。
不要不急の外出を控えることで、どういった地域の人の外出が減り、逆にどういったところが増えるのかを可視化してみようと思いました。

2.データの収集
ではさっそく分析のためのデータを集めよう!と思い、色々なワードでググってみました!


...


ん?


あれ...??



一般的なCOVID-19の感染者数データ等は取得できたが、肝心の人の外出、流出データ等が見つからない...

ここで大変な勘違いをしていたことに気づきます。

今の時代、目的のものをググればデータでもなんでも簡単に無料で手に入ると思い込んでいました。
が実際そうではなく、自治体によって公表されているデータしか存在せず、求めていた人の流出データは、GPS等の統計データを販売している企業からしか入手できそうにありませんでした。

データもない、指定された分析内容もない分析を始める場合、上記の進め方では進めることができず、1.2.の順番を逆にする必要があることに気づきました。

1.データの収集
2.分析テーマの決定
3.分析・インサイト

ここからが本編です...笑

1.データの収集

まずはCOVID-19に関するデータをできるだけ集めてみました!

Google Trend
→COVID-19に関連するトレンドワードの特集が組まれています。

NHK COVID-19特設サイト
→都道府県別の感染者数や、感染者数推移などチャート化されているだけでなく、jsonデータをクライアント側で処理しているため全量データを簡単に取得することが出来ました。

新型コロナ 県別・時系列グラフ
→各自治体が公表している、感染者情報や地域情報をまとめてくれています。

とまぁ、一般に誰でも取得できるような情報を多種多様で集めてみました。


2.分析テーマの決定

では集めたデータより、分析が出来そうなテーマを探っていきます。
当初挙げていた関連ワードですが、集めたデータから分析出そうなものは以下となりました。

①クラスター
 →医療施設、福祉施設でのクラスター
②高齢者、基礎疾患持ちの患者の死亡率増加
 →感染しても無症状の人がいるらしい
⑦おうち時間増加
 →あつもりブーム?
(半分以下...涙)

この中から選択する際に、Google Trendで気になる言葉を見つけました。

Friday Ovation : フライデーオベーション

医療・介護関係者などに向けて、毎週金曜日の正午に感謝の拍手を送る取り組み

COVID-19の患者が増える中、危険を顧みず医療に従事してくれている医療関係者には感謝しきれません。
ただ一部の報道では、病院内でのクラスターが発生しているとの発表もありました。

そこで今回は①クラスターを選択し、感染者の属性から医療従事者がどれだけ危険を顧みず医療に従事してくれているかを可視化したいと思います!

3.分析・インサイト

今回用いる感染者の情報は、各自治体から発表されたものを並べているだけなので、患者の属性に関してはバラバラかつ、複数存在していたので、ある程度のジャンルにグループ化し分析を行いました。


COVID-19 属性別感染者分析

※Tableau PublicにVizを投稿しております。

得られたインサイトとして
属性別日次感染者累計を見ると、医療従事者の感染者がダントツに大きいことが確認できました。やはり他属性の感染者を診断したり、風邪やその他病気の診断に訪れた患者が感染しており、気づかずに感染していることが多いためと想定されます。
また集計表から感染者の詳細な属性を見ると、病院内での感染者が多く発生しており、施設内での感染に伴い医療従事者への感染が多いことに気づかされます。

そして全国的に医療従事者の感染者数が多く、同様の問題が各地で発生していることに加え、どの都道府県でも医療従事者に関しては無症状~軽症・中等症の割合が多く、本人が自覚しない中で院内での感染等をクラスターを拡大させていた可能性があることを示唆しています。


まとめ

今回初めてゼロからの分析を行いましたが、今までやってきたTableauの研修や勉強会と違い、データも作り方の指示も何もない状態で分析することがこれほど大変だとは思いませんでした。

もしこれでBIでの分析も試行錯誤が必要だと思ったらゾッとしますが、Tableauでは直感的に、色々試しながらチャートを作り、その場でインサイトが得られるため非常に有効なツールであることを再確認できました。

引き続きコミュニティ活動に関してはやることがたくさんありますので、継続してブログに記載していきます♪

この記事が気に入ったらサポートをしてみませんか?