見出し画像

GeoPandas同梱データセット、ファイルの読み込み方法

チュートリアルやってて驚いたのが、GeoPandas内にサンプルデータセットがあるようなんです。たしかにサンプルデータがあるとチュートリアルを写経しながらやれば、上手く表示できたりするんでしょうが、手持ちのシェープデータでやってみたいっていうのが普通ですよね。

まあ、その前にそのサンプルデータセットって何があるのか見てみたいですよね。前もって言うと、日本国内のデータは無いので、チュートリアル以外使い道なさそうですけど。では、実際にサンプルを順に表示していきましょう。

データセットのリストを表示する

import geopandas
geopandas.datasets.available
#サンプルデータセットのリストを表示
['naturalearth_cities', 'naturalearth_lowres', 'nybb']

3つしかないんだ。
このデータセットをjupyter notebookを使って表示してみたいと思います。

サンプルデータセットの読み込む

buf = geopandas.datasets.get_path('◯◯◯◯◯◯')
#◯◯◯◯◯◯には上の3つのどれかが入ります。
data = geopandas.read_file(buf)

「naturalearth_cities」って?

世界の都市のポイントデータでした。たしかに少し世界地図っぽいかも。

画像3

「naturalearth_lowres」って?

迷いようもなく、世界各国のポリゴンのようですね。
ただ全部あるのかな?国連加盟国一覧では現在193カ国あるようなんだけど、178個しかポリゴンないようだけど。

画像2

「nybb」って?

ニューヨーク市の行政区らしいです。使わない・・・。

画像3

手持ちのシェープデータを読み込む

結局、手持ちのデータの読み込み方を簡単に書いてくれよ、ですよね。ただでさえ、チュートリアルの自動翻訳が変なのに。

とりあえず、データセットを使わない限り、この関数は使わないことになりますね。geopandas.datasets.get_path('◯◯◯◯◯◯')
【GeoPackageの読み込み】
#同一階層にデータが無いことが大抵だと思うので、「sample.gpkg」はフルパスを入れて下さい。例)/Users/mtkg/Desktop/sample.gpkg
#GeoPackageは複数レイヤを格納する事ができるのでレイヤ名の明示が必要。
data = geopandas.read_file("sample.gpkg", layer='countries')
【シェープデータの読み込み】
#同一階層にデータが無いことが大抵だと思うので、「sample.shp」はフルパスを入れて下さい。例)/Users/mtkg/Desktop/sample.shp
#デフォルトの読み込み文字コードは明示しなくてもutf-8です。文字化けするようなら、shift_jisに変えて下さい。
data = geopandas.read_file("sample.shp", encoding='utf-8')

以上です。

この記事が気に入ったらサポートをしてみませんか?