見出し画像

日本の都市のクラスター分類の再考

「日本の都市のクラスター分類の再考」


 このnoteでは統合失調症の陽性症状が出ている中、妄想にデータ分析をやれと指示されてやったデータ分析を紹介する。内容は結構まともである。統合失調症の陽性症状が出ていても認知機能に衰えはなかった。

1.      はじめに


日本の統計データでは人口30万人以上の市を特別な市としてクラスタリングしているが、この基準を再考する。使用するデータは住民基本台帳ではなく、経済センサス2016とする。経済センサスは有業者の数が就業構造基本調査より少なく、不十分なデータセットと言えるが、市町村レベルまで細分化されたデータであるため、便利であることから採用した。
分類対象は市であり、町と村は除いている。また東京23区だけは区も集計しているが、大阪市や福岡市は区ではなく市で合計して集計している。この点がやや心配なところである。東京都には1万人規模の町や村が存在する。それらを除いていることを留意願いたい。

2.      結果


散布図より、有業者100万人以上の市、18万人より大きく100万人未満、18万人未満の市に大きく分類できることが分かった。さらに有業者18万人未満の地域をさらに詳細にみていくと、結合確率密度分布では1万2千人未満、1万2千人以上で2万人未満、2万人以上3万人未満、3万人以上10万人未満、10万人以上18万人未満に大まかに分けられることが分かった。

3.      今後の展望


クラスターごとの男女比、産業などを調べることができると思われる。産業に関しては調べるのは大変な時間がかかるが、全産業の男女比や正社員比率なら調べられるので調べようと思う。





この記事が気に入ったらサポートをしてみませんか?