![見出し画像](https://assets.st-note.com/production/uploads/images/23060464/rectangle_large_type_2_870c5eff6a1b901a70a9e5b5f7f1f4b1.png?width=800)
Photo by
4yournote913
私が機械学習学び始めに、よく目にして意味不明だったけど、今はよく使っている機械学習用語 #機械学習
そのうちまとめる機械学習用語集
outliers
outliers:外れ値
異常検知
np.percentile(df[対象カラム名], [1, 99])
正規分布
欠損値
np.Nan
マジックコマンド
マジック関数
%%time
教師あり学習
教師なし学習
ニューラルネットワーク
NN
発火
時系列データ
shift(1)
reduce_mem_usage
オンメモリ
可視化
import matplotlib.pyplot as plt
import seaborn as sns
groupby
for i, sub_df in df.groupby(['カラム名']):
KFold
from sklearn.model_selection import KFold
kf = KFold(n_splits=3, random_state=None, shuffle=False)
データフレームのコピー
df_copy = df.copy()
元のデータをいじらない。
チューニング
パラメータチューニング
ハイパーパラメータチューニング
決定木
木構造
バリデーションデータ
トレーニングデータと対になる。
交差検証
scores = cross_val_score(svm, va_x, va_y)
いつもお読みいただき、ありがとうございます。 書くだけでなく読みたいので、コメント欄で記事名入れてもらうと見に行きます。