マガジンのカバー画像

アプリとやらを創ってみようではないか

45
アプリとやらを創ってみようではないか
運営しているクリエイター

#不均衡データ

不均衡データの調整

顧客リスト2000に対してCVRが0.5%。
このデータを機械学習させたとする。

何も考えずにやると、99.5%のレートがでる判定機ができる。
だがまぁ、これってもともと0.5%の確立でCVするって話なので、CVしないって回答してれば99.5%の確立で正解します、ってだけ。

っていう話しがあるってことを前回書きました。

こういう場合は、
サンプルデータを増やしたり減らしたりして調整する方法が

もっとみる

不均衡データ

顧客リスト2000あって、それにメールを送ったとする。
そこから申込が10件あったとする。レートは、10/2000=0.5%。

で、実は、顧客データが2000件は、属性がいろいろわかっていて。
性別とか年齢とか、年収とか。

で、このデータを機械学習させてみたとする。
で、いろんな属性を与えてやったら、「買う」「買わない」のどちらかに振り分けてくれる、そういう振り分け機ができた。

で試してみた

もっとみる