見出し画像

COVID-19ダッシュボード作ってデータサイエンスっぽいことしてみた話

新しい生活様式(ニューノーマル)が各省庁から発表されて約1ヶ月たちました。

経済の話や、GIGAスクール関連など、様々な角度から議論される場が増えてきました。そんな中、マスコミの仕組み上過剰な演出や、ある種のバイアスがあるんじゃなか?って話をたまに聞くようになりました。決して新型コロナウイルスがただの風邪だとか馬鹿なこと言うつもりはありませんし、メディア批判をする類の話でもありません。

単純に事実ベースの数値とか客観的な現状を知りたいといった知識欲から、色んなデータとデータを重ね合わせてみたい!と考え、実際にやってみた話になります。

例えば、インフルエンザと比べるとどうなの?とか都道府県で陽性者数の絶対値ばかり出てくるけど人口比率的にどうなの?といった部分を知りたいとしたときに、インフルエンザの感染者データであるとか、各都道府県の人口データを組み合わせて調べてみるといった感じです。Excelで株のポートフォリオを作って、ほかの数値的情報と重ねて株価収益率なんかを確認する的なイメージかと思います。

実は以前、アーティストやお笑い芸人さんのステイホーム活動に心動かされて、自分なりに何かできることはないか?と考え、新型コロナウイルス感染者を確認できるダッシュボードの作り方

COVID-19ダッシュボードを1時間で作る(Googleデータポータル) 〜お家で出来ること

を公開したことがありました。

その時作った仕組みを利用して他のデータとデータを組み合わせたり比較したりしました。今回は分かったことや失敗したことをまとめてみます。

仕組み(図)

画像1

1.Googleスプレッドシートにデータ集約
2.Googleスプレッドシートでリレーション
3.Googleデータポータルで可視化

やったこと

画像2
画像3

・ヒートマップで可視化
 感染者数で作成していたものを、比較したい数値に対する比率に切り替えることができる機能を実装しました。

・フィルタ
 都道府県ごとの数値、比率等を個別にフィルタできる機能もつけました。

・スマホ対応

画像4

Googleデータポータルはレスポンシブ非対応なので、スマホ用のダッシュボードを別途作成しました。

・可視化した数値
CPR検査/都道府県人口
コロナ感染者数/都道府県人口
コロナ死亡者/都道府県人口

工夫したこと

・自動更新
本当に有り難いことに、有志の方が多くのデータを公開してくれています。
GitHubなどで公開していただいているデータを利用して、Googleスプレッドシートを自動更新できるようにしました。

・ノーコード
とにかくスタートからゴールまでの最短で、Googleデータポータルを採用しました。サブスクアカウントを増やしたくなかったり、新たにコードの勉強で時間を溶かすのも回避したかったためです。(学び自体が好きなので入沼防止)
なので、デザイン変更も一瞬です。
以前のデザイン↓

画像5


・フィルタ機能強化
マップの都道府県部分をタップしたらフィルタがかかって、ダッシュボードの複数の数値がフィルタできます。

・指数をダッシュボード上で変更可能
人口、比率、感染者数、死亡者など、同じグラフで指数を切り替えて表示できるように改良しました。

失敗したこと

・自動更新
データを流し込む作業を自動化するリスクは、ソース元が仕様変更すると影響するということです。なので、オープンデータとか、GitHubで提供していただいているかたがレコードの表題を日本語表記から英語表記に変更したり、1列データ項目を追加したりするとうまく機能しなくなります。
大きな変更でなければ数分で修正できましたが、利用するソース元の選定はとても重要になります。

・レスポンス
SaaSなので、どうすることもできない部分として動きが多少遅かったり、cssを触れないので表示するデバイスにより見え方が変わってしまいます。

やってよかったこと

・気になっていたデータを見ることができた
都道府県の人口比で見ると、確かに東京の感染率は高いが、検査率も高い。であるとか、死亡率からするとこの県はこうだ!といった発見がありました。専門家でないので、ここで具体的な数値や所感は控えますが、自分なりに色々納得できました。

・Googleデータポータルの性能がわかった
はっきり言って、やりたいことほとんどできました。
最近のアップデート(当初作成途中)でGoogleMap連携まで可能になり、数年前に活用していたGoogle純正データベースサービスのGoogle fusiontable的な使い方までできてしまいます。
Power BI よりシンプルで簡単に操作できます。

・自分で選んだデータを解析できる
思いついたときに追加できるので、PowerPointやExcelを編集する感覚で気軽にほしい情報を得ることができます。

まとめ

メリットとしては、
・Googleアカウントがあればできる
・作るまでが爆速
・無料
なので、個人的に数値を組み合わせてガンガン新しい指数をアウトプットすることに向いていますが、
・SaaSの利用制約が大きい
・レスポンスが遅い
・データソース変更に弱い
ことからサービス提供には不向きだと感じました。

他のウイルス感染者のデータとの比較は?とか世界経済と景気低迷による自殺者との相関関係はどうなってるんだ!?などの話がよく出ますが、知りたい情報は人それぞれ。

情報の民主化が進みつつある今、噂やインパクトのある情報に振り回されれず、自分が欲しい情報を自ら手に入れることが重要になってくると思います。ネット上には35ゼタバイトを超える膨大な情報があるそうですが、専門家やデータサイエンティストだけのものではなく、もっと私達の身近なものになればと願っています。

最後まで見ていただきありがとうございました。

この記事が参加している募集

この記事が気に入ったらサポートをしてみませんか?