見出し画像

python pandas crosstab クロス集計

2つ以上の項目を交差させて集計する手法クロス集計を行う crosstab関数。
同じ値をカウントします、数値を足し算するわけではありません。
引数indexに基準の縦軸となるseriesを設定、引数columnsにクロス集計するseriesを設定する。
pandas.crosstab( index=df["カラム名"] , columns=df["カラム名"] )

例(下表)として産地を基準にデータをまとめ、それを品名と価格2つのカテゴリで分割し集計する場合
df_new = pandas.crosstab( index=df["産地"] , columns=[df["品名"] ,
df["価格"]] )

産地と品名を基準にデータをまとめ、それを価格で分割し集計する場合
df_new = pandas.crosstab( index=[df["産地"] , df["品名"]] , columns=df["価格"] )

この記事が気に入ったらサポートをしてみませんか?