seabornでデータビジュアライゼーション(1)ヒストグラム

下準備

seabornでデフォルトデータセット,tips(食事の際にチップを払った客層タイプのデータ)を読み込む。ついでにその他に使用するライブラリもざっと準備。


import numpy as np
import scipy as sp
import pandas as pd

from pandas import Series,DataFrame
from scipy.stats import norm #日本語対応化 
import janome
 #可視化 
import matplotlib.pyplot as plt
import matplotlib as mpl
import seaborn as sns
sns.set()
import plotly.offline
import plotly.express as px
import plotly.graph_objs as go
import plotly.subplots
import squarify
%matplotlib inline
%precision 3
#サンプルデータ  セットtips = sis.load_dataset("tips")

スクリーンショット 2020-08-08 11.50.11

ヒストグラム

diplot関数で描画。
引数kdeはカーネル密度推定を「描画する:True」か「しない:False」かの指定。デフォルトではTrueになっている。

カーネル密度描写無し

スクリーンショット 2020-08-08 11.53.21

カーネル密度推定描写あり

スクリーンショット 2020-08-08 11.58.52

区切り数を大まかor細かに変える。
オプション引数binsの数値を増減させることで細かな区切りに変えられる

スクリーンショット 2020-08-08 12.06.47

ヒストグラムの描画方向を変える。
オプション引数verticalをTrueにすることでグラフを横向きに変えられる。

スクリーンショット 2020-08-08 12.09.39

2つのヒストグラムを同時描写

ランチとディナーのどちらがチップが多いかを比較したい場合、着色したい方のオプション引数colorにredならr、blueならbといった風に指定することで同時描写可能。

スクリーンショット 2020-08-08 12.13.15

質的変数の区別も描写
「喫煙者or非喫煙者」や「男or女」などの客質=質的変数のチップ払いを比較。
countplot(x=質的変数,データセット)で描写。

スクリーンショット 2020-08-08 12.17.56

更に引数hueにカラム名を指定することでより細かく色分けして表示できる。

スクリーンショット 2020-08-08 12.24.14


この記事が気に入ったらサポートをしてみませんか?