#エンジニア
ラグ特徴量で時系列データの精度をあげる
ラグ特徴量とは何か?ラグ特徴量のラグはタイムラグとかのラグと同じです。今の時間の特徴だけに注目せずに過去の特徴を用いて現在のデータの特徴量を増やす方法です。
過去と明言しましたが、未来のデータを使うケースもたまにあります。
しかし、実際には未来のデータを利用するとリークを起こすことがあり、時系列が重視される予測モデルでは過去のデータのみに限定した方が良さそうだというのが私の見解です。
具
「ITってどうやって覚えたらいいの?」という友達の質問に困る
俺「何になりたいの?」
同期「そういうのじゃなくて何となく色々知っておきたい」
俺「・・・・あぁ!?(怒)」
ITってどう学べばいいの?今の時代システムは理解しておいた方がいいとは思いますよね。
僕も最初エンジニアを目指した時は3年程度頑張ってみて、そこから進路を決めようと思っていたので、気持ちはよくわかります。
ただこれについては答えはないと思います。
何がしたいの?何になりたい
俺はただLightGBMを動かしてみたかったんだ
ゼロから作るディープラーニング読んでみたけど...みなさんご存知「ゼロから作るDeep Learning」です。筆者の私は理系のバックグラウンドがあるため、多少四苦八苦しながらも理解できました。
しかし!kaggleで活躍したい!業務に活かしたい!機械学習もっとやってみたい!そこにたどり着くにはこの本を読んだだけでは当然ダメなのです。
とりあえずLightGBM動かしたい詳しい方は突っ込み
ニューラルネットワークの基礎、パーセプトロン|しろくまエンジニア
先日初学者の「そもそもニューラルネットワークって、どうして使う必要があるの?深層学習の知識のある友人が、「色々あるけれど非線形の分類問題に対応できるからだよ」という説明が感動したので絵にしました。
特徴量として身長、体重のデータがあり、その人の出身が日本かアメリカか分ける問題があるとします。これがくっきりと一本の線を、身長と体重のグラフの中に描けたらいいのですが、そうも行かないと思います。
エンジニアは調査隊!|しろくまエンジニア30
自戒の念も込めてですが、新卒の頃はシステムトラブル発生時に「調べてと言われたらまず調べる」状態でした。
しかしこれではいけません。本来コードやログ以外から調べるべきことは山のようにあります。システム担当者だからこそ、それを知っておかなくてはいけません。
調査を依頼してくる側が非エンジニアだと、難しさがわかってなかったり、まずはシステムに投げてみて解決したら嬉しいなと考えているかもしれません
しろくまエンジニア27|Pythonでジャンケンコード
初心者の方で何を最初に作ろうか悩んでいるときは、ジャンケンでも作ってみるといかがでしょうか?
案外奥が深く、複雑なif文になりかけてハマるかもしれません。そこが楽しく、成長のチャンスでもあります。
筆者の実力の底がしれてしまいますが、何もみずに書いてみました。
# coding: utf-8import randomHANDS_LIST = ["グー", "チョキ", "パー"]your