Pythonで各都道府県の時代別の人口推移を分析する
最近、pythonを利用し、データ分析の勉強を行っています。
ちなみにデータ分析で用いた、CSVファイルは以下のサイトのものを参考にしています。
この一見数字まみれのCSVファイルを・・・・・・。
↓↓
こんな感じで、時代別の各主要都市の人口推移のグラフをPythonで作成し、分析するまでを行いました。
グラフからわかること。
①横軸5.0において、東京の人口がかなり減少している。 これは東京大空襲の影響であると考えられる。
②横軸10当たりで、神奈川県の人口の急激な増加がみられる。これは、高度成長期における集団的に地方から上京した人や、ベビーブームが起因しているのではないかと考えられる。
・・・・・・
とデータからグラフを作成し、可視化することで、様々なことが考えられる。
import pandas as pd
import os
os.chdir(r"D:\CSV_sample")
#CSVファイルはUTF-8(BON付き)で保存
c01=pd.read_csv("c01.csv")
print(c01.head(979))
del c01["注"]
print(c01.head(979))
print(c01.head(979).isna().sum())
print(c01.dtypes)
print(c01.groupby("都道府県名").size())
print(pd.pivot_table(c01,index="都道府県名",columns="西暦(年)",values=["人口(総数)"],aggfunc="sum"))
c01_01=pd.pivot_table(c01,index="西暦(年)",columns="都道府県名",values=["人口(総数)"],aggfunc="sum")
print(c01_01)
#c01_01の1行目を手動で削除し、c01_01_01として保存
c01_01_01=pd.read_csv("c01_01_01.csv")
print(c01_01_01)
import matplotlib.pyplot as plt
plt.plot(list(c01_01_01.index),c01_01_01["北海道"],label="Hokkaido")
plt.plot(list(c01_01_01.index),c01_01_01["宮城県"],label="Miyagi")
plt.plot(list(c01_01_01.index),c01_01_01["東京都"],label="Tokyo")
plt.plot(list(c01_01_01.index),c01_01_01["神奈川県"],label=u"Kanagawa")
plt.plot(list(c01_01_01.index),c01_01_01["愛知県"],label=u"Aichi")
plt.legend()
plt.show()
この記事が気に入ったらサポートをしてみませんか?