データの標準化【preprocessing.StandardScaler()】

preprocessing.StandardScaler()

【preprocessing.StandardScaler()の引数】
・引数copy:Trueの場合は元のデータは変換されず、Falseの場合は変換元のデータを使って変換する(デフォルトはTrue)
・引数with_mean: Trueの場合は平均値を0とする。Falseの場合、Y=X/σの変換を施す(デフォルトはTrue)
・引数with_std: Trueの場合は標準偏差を1とする。Falseの場合、Y=X−μの変換を施す(デフォルトはTrue)


# ライブラリのインポート
import pandas as pd
from sklearn.datasets import load_wine

# データのロード
wine = load_wine()
df_wine = pd.DataFrame(data=wine.data,columns=wine.feature_names)
df_wine['target'] = wine.target

# ライブラリのインポート
from sklearn.preprocessing import StandardScaler

# インスタンスの作成
sc = StandardScaler()

# データの適用
sc.fit(df_wine)   

# データの変換したものをDataFrame形式に変更
df_wine_sc = pd.DataFrame(sc.transform(df_wine), columns=df_wine.columns)

# 変換したデータの統計量確認
print(df_wine_sc.describe()['total_phenols'])


データ適応させたインスタンスに対して、.transform()としてデータを指定すると標準化を行なったデータが返ってきます。


この記事が気に入ったらサポートをしてみませんか?