見出し画像

[第3回] Pandasでクロス集計

jupyter notebookとpythonを利用した分析講座となっております。

Pandasを利用したクロス集計

  • Pandasを利用してクロス集計を試してみます。

データフレームの用意

画像1
import numpy as np
import pandas as pd

sex = np.random.choice(['男性','女性'],size=10)
item = np.random.choice(['お皿', 'ナイフ', 'フォーク'],size=10)
price = np.random.choice([100,1000,5000],size=10)

df = pd.DataFrame({'性別':sex,'商品':item,'価格':price})
df

クロス集計方法

商品×性別(数量)

画像2
pd.crosstab(index=df['商品'],columns=df['性別'])

(商品+価格)×性別

画像3
pd.crosstab(index=[df['商品'],df['価格']],columns=df['性別'])

商品×性別(価格合計)

画像4
pd.crosstab(index=df['商品'],columns=df['性別'],values=df['価格'],aggfunc='sum')

商品×性別(比率)

画像5
pd.crosstab(index=df['商品'],columns=df['性別'], margins=True, normalize='columns')

次回講座

この記事が気に入ったらサポートをしてみませんか?