マガジンのカバー画像

アプリとやらを創ってみようではないか

45
アプリとやらを創ってみようではないか
運営しているクリエイター

#機械学習

matplotlibの豆腐問題

pythonでmatplotlibやseabornを使ってると
豆腐問題というのに出くわすことがある。

初期の頃に出会う問題ではあるが、カンタンに言うと、
日本語が□で表示されてしまう、というアレである。

日本語フォント入れて設定してしまえば良いだけなんですけどね。
さっきゼロから環境作ってたら、あれ、うまくいかない。

IPAPGothicを指定してるんだけど、そんなフォントないよ、って言わ

もっとみる

不均衡データの調整

顧客リスト2000に対してCVRが0.5%。
このデータを機械学習させたとする。

何も考えずにやると、99.5%のレートがでる判定機ができる。
だがまぁ、これってもともと0.5%の確立でCVするって話なので、CVしないって回答してれば99.5%の確立で正解します、ってだけ。

っていう話しがあるってことを前回書きました。

こういう場合は、
サンプルデータを増やしたり減らしたりして調整する方法が

もっとみる

不均衡データ

顧客リスト2000あって、それにメールを送ったとする。
そこから申込が10件あったとする。レートは、10/2000=0.5%。

で、実は、顧客データが2000件は、属性がいろいろわかっていて。
性別とか年齢とか、年収とか。

で、このデータを機械学習させてみたとする。
で、いろんな属性を与えてやったら、「買う」「買わない」のどちらかに振り分けてくれる、そういう振り分け機ができた。

で試してみた

もっとみる