しろくまエンジニア

2020年3月18日 16:49

効果検証入門感想その３〜重回帰〜

前回は単回帰のお話をしました。

分析したい時に単回帰を使うととても簡単に何でも表現できます。

前回に引き続き例を上げますが

身長を体重から

成績を勉強時間から

餌の小魚の量から、漁獲できるマグロの量を

と、線を引いて表現することが可能です。

でも実際世の中こんなに簡単ではありません。。。。

そう、マグロの漁獲量１つとっても、天候・季節・時間帯・沖からの距離・水温・地域性・わずかなポ

もっとみる

ひら@包丁とキーボードとペンタプ

2020年3月14日 16:28

効果検証入門感想その２〜回帰〜

効果検証入門の第２章の感想を描き始めました。

今回はみなさんに回帰が何か伝われば嬉しく思います。

前回はRCT（randomized controlled trial）について話しました。簡潔に言うと、「検証や分析においてサンプルがランダムに選ばれていると言うことは非常に重要である。作為的にサンプルを採取していると正しい効果が検証できず、バイアスが掛かった過剰・不足のある結果が得られてしまう。

もっとみる

ひら@包丁とキーボードとペンタプ

2020年1月21日 08:41

ラグ特徴量で時系列データの精度をあげる

ラグ特徴量とは何か？ラグ特徴量のラグはタイムラグとかのラグと同じです。今の時間の特徴だけに注目せずに過去の特徴を用いて現在のデータの特徴量を増やす方法です。

過去と明言しましたが、未来のデータを使うケースもたまにあります。

しかし、実際には未来のデータを利用するとリークを起こすことがあり、時系列が重視される予測モデルでは過去のデータのみに限定した方が良さそうだというのが私の見解です。

具

もっとみる

ひら@包丁とキーボードとペンタプ

2020年1月10日 09:49

俺はただLightGBMを動かしてみたかったんだ

ゼロから作るディープラーニング読んでみたけど...みなさんご存知「ゼロから作るDeep Learning」です。筆者の私は理系のバックグラウンドがあるため、多少四苦八苦しながらも理解できました。

しかし！kaggleで活躍したい！業務に活かしたい！機械学習もっとやってみたい！そこにたどり着くにはこの本を読んだだけでは当然ダメなのです。

とりあえずLightGBM動かしたい詳しい方は突っ込み

もっとみる

ひら@包丁とキーボードとペンタプ

2019年8月27日 07:19

ニューラルネットワークの基礎、パーセプトロン|しろくまエンジニア

先日初学者の「そもそもニューラルネットワークって、どうして使う必要があるの？深層学習の知識のある友人が、「色々あるけれど非線形の分類問題に対応できるからだよ」という説明が感動したので絵にしました。

特徴量として身長、体重のデータがあり、その人の出身が日本かアメリカか分ける問題があるとします。これがくっきりと一本の線を、身長と体重のグラフの中に描けたらいいのですが、そうも行かないと思います。

もっとみる

フォローしませんか？

#AI

効果検証入門感想その３〜重回帰〜

効果検証入門感想その２〜回帰〜

ラグ特徴量で時系列データの精度をあげる

俺はただLightGBMを動かしてみたかったんだ

ニューラルネットワークの基礎、パーセプトロン|しろくまエンジニア