![見出し画像](https://assets.st-note.com/production/uploads/images/147219299/rectangle_large_type_2_5a6dd89c53863840f83e90c10afd6e0f.jpeg?width=1200)
日本の都市のクラスター分類の再考
「日本の都市のクラスター分類の再考」
このnoteでは統合失調症の陽性症状が出ている中、妄想にデータ分析をやれと指示されてやったデータ分析を紹介する。内容は結構まともである。統合失調症の陽性症状が出ていても認知機能に衰えはなかった。
1. はじめに
日本の統計データでは人口30万人以上の市を特別な市としてクラスタリングしているが、この基準を再考する。使用するデータは住民基本台帳ではなく、経済センサス2016とする。経済センサスは有業者の数が就業構造基本調査より少なく、不十分なデータセットと言えるが、市町村レベルまで細分化されたデータであるため、便利であることから採用した。
分類対象は市であり、町と村は除いている。また東京23区だけは区も集計しているが、大阪市や福岡市は区ではなく市で合計して集計している。この点がやや心配なところである。東京都には1万人規模の町や村が存在する。それらを除いていることを留意願いたい。
2. 結果
散布図より、有業者100万人以上の市、18万人より大きく100万人未満、18万人未満の市に大きく分類できることが分かった。さらに有業者18万人未満の地域をさらに詳細にみていくと、結合確率密度分布では1万2千人未満、1万2千人以上で2万人未満、2万人以上3万人未満、3万人以上10万人未満、10万人以上18万人未満に大まかに分けられることが分かった。
3. 今後の展望
クラスターごとの男女比、産業などを調べることができると思われる。産業に関しては調べるのは大変な時間がかかるが、全産業の男女比や正社員比率なら調べられるので調べようと思う。
![](https://assets.st-note.com/img/1720922091413-Bt2uBVz88N.jpg?width=1200)
![](https://assets.st-note.com/img/1720922121516-uAy13Qv4ZY.jpg?width=1200)
![](https://assets.st-note.com/img/1720922151643-dlcUHf75gl.jpg)
![](https://assets.st-note.com/img/1720922177322-Y4bquTDooF.jpg?width=1200)
この記事が気に入ったらサポートをしてみませんか?