データの標準化【preprocessing.StandardScaler()】

2022年2月12日 16:17

preprocessing.StandardScaler()

【preprocessing.StandardScaler()の引数】
・引数copy:Trueの場合は元のデータは変換されず、Falseの場合は変換元のデータを使って変換する（デフォルトはTrue）
・引数with_mean: Trueの場合は平均値を0とする。Falseの場合、Y=X/σの変換を施す（デフォルトはTrue）
・引数with_std: Trueの場合は標準偏差を1とする。Falseの場合、Y=X−μの変換を施す（デフォルトはTrue）

# ライブラリのインポート
import pandas as pd
from sklearn.datasets import load_wine

# データのロード
wine = load_wine()
df_wine = pd.DataFrame(data=wine.data,columns=wine.feature_names)
df_wine['target'] = wine.target

# ライブラリのインポート
from sklearn.preprocessing import StandardScaler

# インスタンスの作成
sc = StandardScaler()

# データの適用
sc.fit(df_wine)   

# データの変換したものをDataFrame形式に変更
df_wine_sc = pd.DataFrame(sc.transform(df_wine), columns=df_wine.columns)

# 変換したデータの統計量確認
print(df_wine_sc.describe()['total_phenols'])

データ適応させたインスタンスに対して、.transform()としてデータを指定すると標準化を行なったデータが返ってきます。

この記事が気に入ったらサポートをしてみませんか？