Excel練習(2回目)

■Excel練習課題

最新のCOVID19感染状況が把握できるようにするために、データをダウンロードしてくるのではなく、Web上のデータソースから、直接、データを持ってくるようにする

■実施した手順

(1)データの取得

①COVID19感染者数

練習1回目にWHOから取得したデータソースのリンクアドレスの取得を試みる。

CSVファイルを取得できるボタンDownload Map Dataからは、リンクアドレスが取得できなかったが、UNOCHA's Humanitarian Data Exchange (HDX ) platformというところで、情報取得できる記述を見つける。

リンク先に飛ぶが、PAGE NOT FOUNDの表示

https://data.humdata.org/dataset/coronavirus-covid-19-cases-data-for-china-and-the-rest-of-the-world

仕方ないので、メインページで検索実施。

search keyword:coronavirus-covid-19-cases-data

検索結果から、次のファイルを発見

Coronavirus (COVID-19) Cases and Deaths
World Health Organization
2800+ Downloads

https://docs.google.com/spreadsheets/d/e/2PACX-1vSe-8lf6l_ShJHvd126J-jGti992SUbNLu-kmJfx1IRkvma_r4DHi0bwEW89opArs8ZkSY5G2-Bc1yT/pub?gid=0&single=true&output=csv

②国別情報(Country Codelist)

WHOサイトで、①に紐づけできそうな国別マスター情報を取得。

試しにJSON形式のファイルを利用を試みたが、階層が深くExcelで読み込むには便利でないようであったので、最終的には、CSVファイルを利用することにした。

https://apps.who.int/gho/athena/data/xmart.csv?target=COUNTRY&profile=xmart

(2)Excelで利用した操作/機能など

利用したExcel:Excel for Microsoft 365 MSO

①データのウェブから取得設定

それぞれのCSVファイルで次の作業を実行

(a)メニュー:データ>データの取得と変換>Webから

(b)それぞれのリンクアドレスを指定して読み込み処理

*それぞれのファイルで、文字コードをUTF-8に指定

(c)読み込み先を指定、を選択し読み込むとデータのインポート画面が表示される

(d)接続のみ作成/このデータをデータモデルに追加する、にチェックを入れてOK押下

②2つのCSVファイルの結合

(a)メニュー:データ>データの取得と変換>データの取得>クエリの結合>マージ

(b)マージ画面が表示されるので、マージするCSVファイルを選択する

1つ目のCSVファイルではISO_3_CODEを、2つ目のCSVファイルでは、DimensionMemberCodeを選択してマージすると、1つ目のCSVファイルの国に関連するデータが紐づけされる。

(c)マージされたテーブルが表示されるので、不要な列があれば削除すると良いと思う。

(d)練習1回目と同様に、累積値を求めたかったため、日付フィルターで最新の値だけ表示されるようにする。

③クエリ名を適当に入力して設定した後に、閉じて読み込むを押下して、シートに作成したクエリデータを読み込む。

④練習1回目と同じ表示対象とするために、WHO_REGIONでWestern Pasificのみを表示に設定する。

⑤通常のグラフを作成する。

こんな感じで作成したのが次のファイルです。リンク先のデータが更新されると、このファイルのデータも更新されていくかどうかは、まだ未確認です。

■6月7日追記

確認したところ、データが更新されました。

いいなと思ったら応援しよう!