pythonでデータ可視化・データ分析『倉敷市 人口」
※リソース
data eye https://kurashiki.dataeye.jp/
今回はpandasやmatplotlibの練習。単純な円グラフを作る。seabornでは円グラフは描写できないみたいです。
円グラフは、なにか1つの対象の中身(構成比)をみるのに良いので、倉敷市の人口でやってみることにする。
まずは、全体での男女比。
fig = plt.figure(figsize=(8,6))
x_labels=['male','female']
color = ['0.9','0.9']
plt.pie(x,startangle=90, counterclock=False, labels=x_labels, colors=color,labeldistance=1,
wedgeprops={'linewidth': 3, 'edgecolor':"white"},
autopct="%1.1f%%", pctdistance=0.5)
plt.axis('equal')
plt.title('倉敷市民 男女比 ')
plt.show()
文字が小さかった。
次は、地区別。
上位4位以外を「その他」でまとめることに苦労した。結局、SUMしたものをloc[新規行名]で追加、index名を編集、でできたけど、もっといいやり方ないのかな。行のSUMってどうやるのがいいんだろう。
グラフは、
fig2 = plt.figure(figsize=(8,6))
x2 = k4_df.loc[:,'total']
x_labels=k4_df.index
plt.rcParams["font.size"] = 18
color = ['0.6','0.9','0.9','0.9','0.9']
plt.pie(x2,startangle=90, counterclock=False,colors=color,labeldistance=1.1,labels=x_labels,
wedgeprops={'linewidth': 1.5, 'edgecolor':"white"},
autopct="%1.1f%%", pctdistance=0.7)
plt.axis('equal')
plt.title('倉敷市民 地区別比 ',fontsize=36)
plt.show()
追記
その他をまとめる方法がみつかった。これなら一行でできる。
df.loc[~((df['カラム']=='1位')|
(df['カラム']=='2位')|
(df['カラム']=='3位')|
(df['カラム']=='4位')),'honorific']='その他'
この記事が気に入ったらサポートをしてみませんか?