Excel練習(2回目)
■Excel練習課題
最新のCOVID19感染状況が把握できるようにするために、データをダウンロードしてくるのではなく、Web上のデータソースから、直接、データを持ってくるようにする
■実施した手順
(1)データの取得
①COVID19感染者数
練習1回目にWHOから取得したデータソースのリンクアドレスの取得を試みる。
CSVファイルを取得できるボタンDownload Map Dataからは、リンクアドレスが取得できなかったが、UNOCHA's Humanitarian Data Exchange (HDX ) platformというところで、情報取得できる記述を見つける。
リンク先に飛ぶが、PAGE NOT FOUNDの表示
https://data.humdata.org/dataset/coronavirus-covid-19-cases-data-for-china-and-the-rest-of-the-world
仕方ないので、メインページで検索実施。
search keyword:coronavirus-covid-19-cases-data
検索結果から、次のファイルを発見
Coronavirus (COVID-19) Cases and Deaths
World Health Organization
2800+ Downloads
②国別情報(Country Codelist)
WHOサイトで、①に紐づけできそうな国別マスター情報を取得。
試しにJSON形式のファイルを利用を試みたが、階層が深くExcelで読み込むには便利でないようであったので、最終的には、CSVファイルを利用することにした。
https://apps.who.int/gho/athena/data/xmart.csv?target=COUNTRY&profile=xmart
(2)Excelで利用した操作/機能など
利用したExcel:Excel for Microsoft 365 MSO
①データのウェブから取得設定
それぞれのCSVファイルで次の作業を実行
(a)メニュー:データ>データの取得と変換>Webから
(b)それぞれのリンクアドレスを指定して読み込み処理
*それぞれのファイルで、文字コードをUTF-8に指定
(c)読み込み先を指定、を選択し読み込むとデータのインポート画面が表示される
(d)接続のみ作成/このデータをデータモデルに追加する、にチェックを入れてOK押下
②2つのCSVファイルの結合
(a)メニュー:データ>データの取得と変換>データの取得>クエリの結合>マージ
(b)マージ画面が表示されるので、マージするCSVファイルを選択する
1つ目のCSVファイルではISO_3_CODEを、2つ目のCSVファイルでは、DimensionMemberCodeを選択してマージすると、1つ目のCSVファイルの国に関連するデータが紐づけされる。
(c)マージされたテーブルが表示されるので、不要な列があれば削除すると良いと思う。
(d)練習1回目と同様に、累積値を求めたかったため、日付フィルターで最新の値だけ表示されるようにする。
③クエリ名を適当に入力して設定した後に、閉じて読み込むを押下して、シートに作成したクエリデータを読み込む。
④練習1回目と同じ表示対象とするために、WHO_REGIONでWestern Pasificのみを表示に設定する。
⑤通常のグラフを作成する。
こんな感じで作成したのが次のファイルです。リンク先のデータが更新されると、このファイルのデータも更新されていくかどうかは、まだ未確認です。
■6月7日追記
確認したところ、データが更新されました。