オープンデータを集計してみる part3 地価データの可視化
はじめに
今回はいよいよ公示地価の集計・可視化を実施していきます。考察までする気はありませんが、感想程度は述べるつもりです。はじめに断っておきますが、可視化結果や感想で地域や個人のことを上げたり下げたりする意図はありません。また、集計そのものは東京都(島嶼部を除く)で実施ししましたが、地図表示の都合上ほぼ都心部しかできません。ご了承ください。
集計と可視化
集計の概要
まず、集計の方法について触れていきます。part2で作成した街データ(ポリゴン)に対して、その各街内に含まれる地価公示データ(ポイント)を空間結合し、地価公示データの属性値である地価の平均をとりました。この時、地価公示データの属性の「標準地コード」を使い、住宅地と商業地をそれぞれ分けて集計しています。
具体的なツールについてはPythonのGeoPandasというライブラリで空間結合し、Pandasのgroupybyメソッドで平均を求めました。参考程度ですが、コードは以下の通りです。
tokyo_town_point_price_residential_gdf = gpd.sjoin(
tokyo_small_erea_gdf_d, price_point_residential_gdf,
how='left', predicate='intersects'
)
agg_dict = {}
agg_list = ['mean' if col == 'price' else 'first' for col in tokyo_town_point_price_residential_gdf.columns]
for col, agg in zip(tokyo_town_point_price_residential_gdf.columns, agg_list):
agg_dict[col] = agg
tokyo_town_price_residential_df = tokyo_town_point_price_residential_gdf.groupby(level=0).agg(agg_dict)
コードについての詳細は次回触れる予定ですが、肝は一番上の街ポリゴン(tokyo_small_erea_gdf_d)と住宅地の地価公示ポイント(price_point_residential_gdf)を空間結合している箇所です。共通のキーがなくても空間情報で結合できるというのは非常に強力ですね。
集計に際しての注意点
今回は街単位で集計していますが、全てのエリアに地価公示ポイントがあるとは限りません。ポイントが全くない場合は集計対象外になります。また、ポイント数が1つや2つなど少ない場合については集計対象にしています。本来はサンプルの少ない平均を取得することはあまりしませんが、地価公示そのものが標準的な価格であることと、そもそもポイント数がないので集計から外すとかしていられないというのが本音です。
住宅地の集計結果
住宅地の地価公示を集計した結果を以下に示します。(上位10エリアのみ)
六番町 4,390,000 円/㎡
三番町 3,600,000 円/㎡
一番町 3,400,000 円/㎡
九段北 3,340,000 円/㎡
赤坂 3,057,500 円/㎡
南麻布 2,945,000 円/㎡
南青山 2,480,000 円/㎡
元麻布 2,450,000 円/㎡
恵比寿西 2,435,000 円/㎡
白金台 2,266,700 円/㎡
最も高いのは六番町でした。単価450万円は驚きです。また、地図に落とすと以下の通りです。
単価200万円以上の街は名前を出していますが、やはり赤坂・六本木・南麻布など港区が多いですね。持ち家の人は当然のことながら、賃料も相当でしょうから、信じられない富裕層が住んでいるのでしょう。その実態は知らないですが、港区女子という言葉が出てくるのも納得ですね。。
商業地の集計結果
次は商業地の集計を示していきます。(上位10エリアのみ)
丸の内 31,850,000 円/㎡
銀座 25,043,330 円/㎡
宇田川町 24,400,000 円/㎡
大手町 23,533,330 円/㎡
京橋 16,066,670 円/㎡
道玄坂 15,906,670 円/㎡
霞が関 15,100,000 円/㎡
八重洲 15,026,670 円/㎡
内幸町 14,100,000 円/㎡
新宿 14,043,330 円/㎡
住宅地とは文字通り桁が違いますね。丸の内、銀座、大手町など納得の街に加えて、渋谷新宿など少し毛色の違う街もあります。このリストについては「でしょうね。」という感想で、特に違和感はありませんでした。また、住宅地と同じように地図に落としてみたのが以下になります。
今回は単価500万円以上でラベリングしてみましたが、やはり千代田区・中央区が多く、加えて渋谷、新宿、池袋、品川近辺も単価が高いですね。個人的な推測ですが、大手町・丸の内にはこれまでの日本経済を支えてきたような企業が居を構えているのに対して、港区・渋谷区あたりの企業は今勢いがあって、儲けている企業が沢山いるイメージです。今度調べてみようと思います。
まとめ
所感
今回はデータの可視化まで行いました。登場人物は住宅地にしても商業地にしても都心3区(千代田区・中央区・港区)+渋谷区といった感じですね。需給の関係で値段が決まるのが正しいのであれば、どれだけ一極集中しているのか想像がつきます。安全面から見たら、地盤がしっかりしている訳でもなく、荒川が氾濫したら水浸しになってしまうような土地に、お金持ちの人や企業ばかりが集まっているのもの、何かそれ以上の価値があるからなんでしょう。その辺も別の機会に探っていければと思います。
次回以降の流れ
次回は可視化や分析についての環境やライブラリについて触れようと思います。かなり偏った内容になる気がします。最終回は、今回のような感想ではなく、地価についてもう少し深掘りした考察をしていこうと思います。
今回もありがとうございました!
この記事が参加している募集
この記事が気に入ったらサポートをしてみませんか?