#AI
ラグ特徴量で時系列データの精度をあげる
ラグ特徴量とは何か?ラグ特徴量のラグはタイムラグとかのラグと同じです。今の時間の特徴だけに注目せずに過去の特徴を用いて現在のデータの特徴量を増やす方法です。
過去と明言しましたが、未来のデータを使うケースもたまにあります。
しかし、実際には未来のデータを利用するとリークを起こすことがあり、時系列が重視される予測モデルでは過去のデータのみに限定した方が良さそうだというのが私の見解です。
具
俺はただLightGBMを動かしてみたかったんだ
ゼロから作るディープラーニング読んでみたけど...みなさんご存知「ゼロから作るDeep Learning」です。筆者の私は理系のバックグラウンドがあるため、多少四苦八苦しながらも理解できました。
しかし!kaggleで活躍したい!業務に活かしたい!機械学習もっとやってみたい!そこにたどり着くにはこの本を読んだだけでは当然ダメなのです。
とりあえずLightGBM動かしたい詳しい方は突っ込み
ニューラルネットワークの基礎、パーセプトロン|しろくまエンジニア
先日初学者の「そもそもニューラルネットワークって、どうして使う必要があるの?深層学習の知識のある友人が、「色々あるけれど非線形の分類問題に対応できるからだよ」という説明が感動したので絵にしました。
特徴量として身長、体重のデータがあり、その人の出身が日本かアメリカか分ける問題があるとします。これがくっきりと一本の線を、身長と体重のグラフの中に描けたらいいのですが、そうも行かないと思います。