見出し画像

私の住む街の人口の重心はどこ? データアナリストへの道#17

デジテック for YAMAGUCHI 運営事務局 兼 Y-BASEスタッフのハラマルです。

先日、HPやTwitter等でもお知らせしたところですが、やまぐちDX推進拠点「Y-BASE」の開館日が変更になります
2月からは、月曜日も開館し、ニーズの多い平日全て(月~金)でDXコンサルが可能になります
令和3年11月に開館して1年ちょっとになりますが、お客様からの問い合わせが、施設見学からDXコンサルに大きくシフトしてきているのを肌感覚で実感しています。DXコンサルを申し込みたいけれど、希望日は予約が埋まっているという声もお聞きするようになり、年度途中ではありますが、開館日を変更することにしました。
主に、イベントや施設見学用に開館していた土曜日は、2月以降、イベント時に開館することにさせていただきますので、御留意ください。

2月以降の月曜日の予約は、もうできるように予約フォームを変更していますので、御利用ください。(以下のサイトで、最初に「メニュー」を選択すると、予約可能日が「○」で表示されます。)

「人口の重心」について

さて、先日、とある報道で、「人口の重心が南東に2.2km移動した」といった記事を目にしました。
はて?何のことだろう?ということで、ニュースソースを探してみると、以下のサイトが見つかりました。

上記サイトから引用

どうやら、「人口重心」とは、一人ひとりが体重だと仮定して、地域内(全国とか都道府県とか)の人口が、どこでバランスが取れるかという地点のようです。
私(ハラマル)のような人がいるので、「一人ひとりが同じ体重」という仮定が無理がありますが(笑)、そういう統計だということです。
全国で見ると、東京とか大阪の方に少しずつ向かっている(そっちに住む人の割合が多くなっている)とのことです。
う~ん、そう言われるとそうなのかもしれませんが、何か話が壮大すぎて、イマイチ、ピンときませんね。

ところで、この重心って、どうやって計算しているのでしょうか?
それも上記サイトに記載されていました。

上記サイトから引用

詳しくはよく分かりませんが、まず、市区町村ごとに人口重心を求めて、都道府県→全国と計算していっているようです。

ということは、都道府県や市区町村データがあるっていうことのようです。これ、もうちょっと分析してみたら面白いのでは?ということで、データ分析をしてみることにしました。

データの収集

ネット検索すると、以下のページに、過去の情報も含めて掲載されているようです。全国・都道府県・市町村のデータがあります。

とりあえず、ここにあるデータをくっつけてみます。
2015以前は、なぜか緯度・経度の桁数が違った(小数点の位置が違った)ので、1000で割って桁数を合わせて、はい!Tableauに投入!
すると、、、あれ?

全国の人口重心・・・?

報道では、全国の重心は、岐阜県にあるとされていましたが、2015年以前は愛知県にプロットされていますね?
ん?2015年以前?さっき、桁数が違うからといって数字を加工したやつですね。あ、これは何か間違いをしている可能性が高いですね。

ネットでいろいろ調べてみると、これか?という情報に行き当たりました。地図データを扱ったことがある方には常識なのかもしれませんが、緯度経度情報っていうのは、一般的には60進法(東経●度●分●秒)で表されていますが、Tableauで用いるためには10進法(130.000みたいな表示)にする必要があるそうです。
上記サイトに掲載されているデータは、2015年以前は全て60進法で表示されていたようです。よく見ると、2020年は、10進法と60進法のデータが用意されていて、知らないうちに私は10進法の数字を使っていたようです。

いや、気づけよっていうツッコミがありそうですが、後ほど紹介しますけれども、60進法での表記も、10進法の表記とよく似ていているんですよ(笑)

データ形式の整理(60進法→10進法)

さて、それでは、やらないといけないのは、2015年以前の60進法データを10進法データに変換することです。

ネットを検索してみると変換用の関数という紹介がいくつかありましたが、データが「137° 03' 20.44"」(137度 03分 20.44秒)みたいに、データの中に「°」とか「'」とかが含まれている場合のもののようです。
今回入手したデータは、そういった単位を表す記号は含まれていませんので、そのままはつかえなさそうです。
仕方ありません、そうしたサイトを参考に、同じような手法で自分でやってみましょう。

まず、2020年は60進法と10進法の両方のデータが掲載されていましたので、これを比較してみます。

2020年の全国の「人口重心」 60進法表示と10進法表示

上段の60進法では、「137度03分20.44秒」と表示されていますが、入力されているデータは「1370320.44」です。
下段の10進法では、表示どおりの「137.055679」というデータが入っています
ね?似てますよね?1000倍したらそのまま使えそうに見えちゃいますよね?私だけでしょうか?

さて、サイトから得た知識を活用して、これを変換していきます。
まず、60進法のデータで、一つのセルに格納されている数字を、度、分、秒に分けていきます。
やり方はいろいろあるかと思うのですが、今回は対象は日本だけで、決まった範囲内に数字が収まりますので、それを使って簡便にやってみます。
具体的には、例えば緯度の「度」であれば、120台から140台に限られますので、このデータから「左の3つの数字」をLEFT関数で引っ張り出します。
「分」であれば、「左から4つめの文字から2文字」をMID関数で引っ張り出します。
「秒」は、キリが良ければ小数点以下がないため、文字数が不確定です。
このため、最初にLEN関数で文字数をカウントしておき、「度」「分」で使う左から5文字を除く文字列を、「RIGHT」関数で抜き出します。

最後に、度はそのまま、分は60で除した数字、秒は3600で除した数字を、それぞれ足し上げると、10進法への転換が終わります。
正解の10進法表示と比べると、最後の桁あたりで誤差が出てきてしまっていますが、まぁ、今回のような分析なら許容範囲でしょうか。

60進法→10進法への変換(G列~L列)

全国の人口重心

それでは、10進法に変換したデータをTableauに投入して、「全国」だけをマッピングしてみましょう!

全国の人口重心 2005,2010,2015,2020

お!今度は確かに岐阜県内にマッピングできましたよ!どうやら成功したようです。もうちょっと詳細に見てみましょう。

全国の人口重心 1965-2020(5年毎)
全国の人口重心 1965-2020(5年毎)

確かに、1965年以降、南東方向に動いていますが、2005年頃までは東に、それ以降のこの15年間は、東よりも南に動く距離の方が大きいようです。
リリース文では、東京や大阪への人口の集中というような解説がありましたが、こうした動きの変化はどういう要因があるんでしょうかね?

う~ん、解説文を読んだときは、何となく、なるほどと思いましたが、いろいろ気になってきましたね。

都道府県の人口重心

それでは、もう少し要因を探るため、次は都道府県単位で見てみましょう。
都道府県単位での変動をマップで捉えるのは難しそうですね。

都道府県の人口重心 2005,2010,2015,2020

それでは、この15年間に絞って、各都道府県の人口重心がどの方向にどれくらい移動したかグラフ化してみましょう。
確か、以前、Tableauの機能を使って、新しく計算フィールドを作成したことがあるような。
そうそう、この時に、ダンベルチャートを作ろうとして似たような処理をしていますね。noteを初めて1年半くらいになりますが、最近特に思うのは、過去の自分の投稿が、復習素材としてとても有用なんですよね。

話が逸れてしまいましたが、今回は、2005年と2020年の緯度・経度の差を算出し、それをグラフにしてみました。

全国・都道府県の人口重心の移動状況(2005→2020の15年間)

あれ?東京方面に人口が集まっているということから、各都道府県は東京方面に移動するものかと思いきや、そうなっていないですね。山口県なんかは、真南に少し動いています。

一番移動が大きいのは北海道ですが、東京方向の南ではなく、西に動いていますね。マップで見るとこんなカンジです。移動距離が大きいといっても、地図で見ると大したことないように見えますね。

北海道の人口重心 2005,2010,2015,2020

う~んと、これはどういう状況かと考えると・・・。
全国レベルで見ると東京への人口集中が進んでいるので、元々の中心が東京方向に移動しています。
が、道府県単位で見ると、東京都に転出した人を除いて、転入してきた人を加えて、さらに域内での死亡や出生・移動などを踏まえて新たな人口重心が定まるわけですね。だから、必ずしも東京方向に動くわけではないわけですね。冷静に考えたら当然のことかもしれません。

例えば、転出や死亡が多い地域は、重心の計算上は軽くなり、転入や出生が多い地域は、重心の計算上は重くなるということですね。
なので、重心の移動は、その都道府県内で、その方向に多くの人が住むエリアが移動しつつある、ということでしょうか。

ちなみに、一番人口の多い東京都は、真東へ動いていますね。

東京都の人口重心 2005,2010,2015,2020

元々の人口総数が多い東京都の中でも、東側に人口が寄ってきているというのは興味深い状況ですね。
東京都の東側に、地方から多くの人が移り住んでいるのか、東京都の中でも人口集中が進んでいるのか、どちらの要素もあるのかもしれませんね。

結局、南側への移動要因がよく分かりませんでしたね。
東西方向であれば、元々東京は日本の中で東寄りに位置しているため、東京に集まるとすれば、西に移動してくる人より東に移動してくる人が多いので、東方向に動くというのは分かります。

ただ、南北方向でも、東西方向とほぼ同じ距離の移動をしていますので、何らかの理由があるんだとは思います。
東京都以南から東京に移住する人より、東京都以北から移住する人の方が多いのか、沖縄など南への移住が影響しているのか?

公式さんの詳細分析が知りたいですし、もしかしたら違うアプローチから分析できるのか、引き続き、考えてみたいと思います。

山口県の人口重心

最後に、山口県の人口重心を見てみましょう。
報道にもあったのでご存知の方もいらっしゃると思いますが、山口県の人口重心は、防府市の切畑という地域になります。
そして、先ほどのグラフにもあったのですが、この15年間では、ほぼ南に少しずつ動いています。

山口県の人口重心 2005,2010,2015,2020

県内市町の人口重心を、都道府県と同じように視覚化してみました。
ただし、2005年データは、一部の市町村合併前でしたので、通しでの分析が難しかったので、ここからは2010年以降のデータになります。

山口県内市町の人口重心 2010,2015,2020
山口県内市町の人口重心の移動方向(2010→2020)

山口市・萩市が南西方向に、上関町が北東方向に大きく動いていますね。

山口市の人口重心 2010,2015,2020
萩市の人口重心 2010,2015,2020
上関町の人口重心 2010,2015,2020

反対に、防府市はほとんど動いていないですね。新しく住宅街みたいなものができても、総数としてあまり影響がない程度なのか、たまたま東西方向もバランスが取れているのか、どうなんでしょうね。

防府市の人口重心 2010,2015,2020

市町単位で見ると、市町の中で、人口集中が進んでいるのは、こっち方向だというのは、なんとなく肌感覚で分かると思いますが、大体、その通りになっていたでしょうか?

まとめ

日本の人口重心が岐阜県だからと言って首都が変わるわけではないように、また、地形的に人が住むのに適したエリアがどこにあるのかといった要素も関係してくるので、都道府県・市町村の人口重心がどこだということ自体にはあまり意味がないと思います。

ただ、そういう「データ」があって、それが蓄積されて、公開されると、こんな風にいろいろと分析してみることができます。

公式さんには、是非、今後もデータを公開していってほしいですし、できれば、過去のデータも別のところに格納してあるのであれば、整理して分かるようにしてほしいですね。
もっと言うと、10進法データも置いておいてください!

それと、最初に触れたように、一人ひとりの体重が同じという仮定が、どうも引っ掛かるので、平均体重になるように頑張ります。でないと、ハラマルさんのせいで重心が動きましたよ、との指摘を受けかねません!