Pythonでグラフを描く②ヒストグラムの作成

ここではシリーズ①で読み込んだデータセットのヒストグラムを作成する。

まずはライブラリーのインポート。

import numpy as np
import pandas as pd
from pandas import Series,DataFrame
import matplotlib.pyplot as plt
import seaborn as sns
sns.set_style('whitegrid')#グラフの背景を白くする
%matplotlib inline

次にファイルのインポートをして最初の10行を表示する。

df2=pd.read_csv('sample.csv')
df2.head(10)

画像1

ちなみに、インポートしたCSVファイルはこれ↓。前回のシリーズで作成したデータセット。

読み込めたのが確認できたので、ヒストグラムを作成する。まずは、Score1に関してヒストグラムを作成する。

sns.distplot(df2.Score1)

画像2

平均値50で標準偏差20で正規分布しているデータセットなので、ほれぼれするぐらいきれいなヒストグラムが描けた。

次に、Score1、Score2、Score3のヒストグラムを作成していく。plt.subplot()のコードでどこにグラフを描くか指定して、sns.distplot()でヒストグラムを描く。今回はsns.distplot()のカッコ内で色(color=)を指定する。Score1を青色、Score2を緑色、Score3を赤色にしてみた。

 #Score1のヒストグラム 
plt.subplot(2,2,1)#グラフの場所を指定
sns.distplot(df2.Score1, color='blue')
 #Score2のヒストグラム 
plt.subplot(2,2,2)#グラフの場所を指定
sns.distplot(df2.Score2,  color='green')
 #Score3のヒストグラム 
plt.subplot(2,2,3)#グラフの場所を指定
sns.distplot(df2.Score3, color='red')

画像3

グラフが小さいので、大きさを変更する。plt.figure(figsize=())を使ってグラフを大きくする。

plt.figure(figsize=(10,10))#グラフの大きさの設定
plt.subplot(2,2,1)#グラフの場所を指定
sns.distplot(df2.Score1, color='blue')

plt.subplot(2,2,2)#グラフの場所を指定
sns.distplot(df2.Score2,  color='green')

plt.subplot(2,2,3)#グラフの場所を指定
sns.distplot(df2.Score3, color='red')

画像4

グラフが大きくなった。

今日はこんな感じ。