DE9:オープンデータ【データサイエンティスト検定(リテラシーレベル)補習ノート】

データサイエンティスト検定(リテラシーレベル)の公式リファレンスブックで躓いたところをまとめていきます。

DE9ではオープンデータの例がいくつか挙げられていますが、よく知らないものもあったので調べておきます。

DATA.GO.JP

デジタル庁が整備、運営するオープンデータに係る情報ポータルサイトです。各省庁横断で様々なデータセットにアクセスできるようです。データセットの一覧はこちらから確認できます。

2021/09/12現在、27,526 件のデータがあります。ただ大半は報告書などのPDFデータで、XLSやCSVなどすぐにデータ分析に使えるのは3,000件ほどのようです。

これまでの行政サイト(e-Statなど)に比べると、ワードを入力して検索するだけなので使い方が簡単だと思いました。ただし、人口動態や家計調査などの定番の統計データがやや見つけづらいです。


e-Stat

https://www.e-stat.go.jp/

e-Statは総務省統計局が管理しているサイトです。統計データが一通りそろっているようです。

e-Statはこちらは人口動態や家計調査など定番の統計データが見つけやすいのが特徴です。特に統計ダッシュボードを使うと、定番の統計データがすでにグラフ化された状態で置いてあるので便利です。

https://dashboard.e-stat.go.jp/


国土数値情報ダウンロード

国土交通省が管理しているサイトです。その名の通り、国土に関するデータがそろっています。

データには地理情報が付加されているので、マップ上にデータを表示したいといった用途には役立つと思います。


RESAS

RESASは内閣府と経済産業省が運営するサイトで、産業構造や人口動態、人の流れなどの官民ビッグデータを集約し、可視化するシステムです。

こちらはデータセットがあるというより、データの可視化に特化したサイトといえそうです。特に観光マップ>目的地分析で、どの地域から多く来客しているかを調べたりするのはユニークで面白いと思いました。


参考資料



この記事が気に入ったらサポートをしてみませんか?