見出し画像

Pythonで各都道府県の時代別の人口推移を分析する

最近、pythonを利用し、データ分析の勉強を行っています。

ちなみにデータ分析で用いた、CSVファイルは以下のサイトのものを参考にしています。


キャプチャ_1

この一見数字まみれのCSVファイルを・・・・・・。

↓↓

画像2

こんな感じで、時代別の各主要都市の人口推移のグラフをPythonで作成し、分析するまでを行いました。

グラフからわかること。

①横軸5.0において、東京の人口がかなり減少している。 これは東京大空襲の影響であると考えられる。

②横軸10当たりで、神奈川県の人口の急激な増加がみられる。これは、高度成長期における集団的に地方から上京した人や、ベビーブームが起因しているのではないかと考えられる。

・・・・・・

とデータからグラフを作成し、可視化することで、様々なことが考えられる。

import pandas as pd
import os

os.chdir(r"D:\CSV_sample") 
#CSVファイルはUTF-8(BON付き)で保存

c01=pd.read_csv("c01.csv")
print(c01.head(979))

del c01["注"]
print(c01.head(979))

print(c01.head(979).isna().sum())


print(c01.dtypes)

print(c01.groupby("都道府県名").size())

print(pd.pivot_table(c01,index="都道府県名",columns="西暦(年)",values=["人口(総数)"],aggfunc="sum"))

c01_01=pd.pivot_table(c01,index="西暦(年)",columns="都道府県名",values=["人口(総数)"],aggfunc="sum")
print(c01_01)

#c01_01の1行目を手動で削除し、c01_01_01として保存


c01_01_01=pd.read_csv("c01_01_01.csv")
print(c01_01_01)

import matplotlib.pyplot as plt
plt.plot(list(c01_01_01.index),c01_01_01["北海道"],label="Hokkaido")
plt.plot(list(c01_01_01.index),c01_01_01["宮城県"],label="Miyagi")
plt.plot(list(c01_01_01.index),c01_01_01["東京都"],label="Tokyo")
plt.plot(list(c01_01_01.index),c01_01_01["神奈川県"],label=u"Kanagawa")
plt.plot(list(c01_01_01.index),c01_01_01["愛知県"],label=u"Aichi")


plt.legend()
plt.show()

この記事が気に入ったらサポートをしてみませんか?