見出し画像

私が機械学習学び始めに、よく目にして意味不明だったけど、今はよく使っている機械学習用語 #機械学習

そのうちまとめる機械学習用語集

outliers

outliers:外れ値

異常検知

np.percentile(df[対象カラム名], [1, 99])

正規分布

欠損値

np.Nan

マジックコマンド

マジック関数

%%time

教師あり学習

教師なし学習

ニューラルネットワーク

NN

発火

時系列データ

shift(1)

reduce_mem_usage

オンメモリ

可視化

import matplotlib.pyplot as plt
import seaborn as sns

groupby

for i, sub_df in df.groupby(['カラム名']):

KFold

from sklearn.model_selection import KFold
kf = KFold(n_splits=3, random_state=None, shuffle=False)

データフレームのコピー

df_copy = df.copy()

元のデータをいじらない。

チューニング

パラメータチューニング

ハイパーパラメータチューニング

決定木

木構造

バリデーションデータ

トレーニングデータと対になる。

交差検証

scores = cross_val_score(svm, va_x, va_y)


いつもお読みいただき、ありがとうございます。 書くだけでなく読みたいので、コメント欄で記事名入れてもらうと見に行きます。