~序章~ 惨敗!街コン 編

ちょうど1年前に、機械学習に興味を持った夜…

私はSINATEが開催していた、街コンをレコメンドするというコンペに参加していました

ユーザーの過去の街コンへの参加ログから、将来どの街コンに参加するかを予測するというものです

当時の私のスペックは下記の通りです

・pythonがあまり書けない
・ランダムフォレストが最強と思っていた

そのため、果たして何をどうやったらレコメンドできるのかもわかっておらず・・・ググってみると、どうやらword2vecを用いると良いらしい(*1)ことがわかりました

どうにかこうにかword2vecとcosine類似度でゴニョゴニョした結果、途中まではトップのスコアが出せたので「これはいけるのでは・・・」と思ったのも束の間、後半どんどん抜かされていき、155人中10位という結果に終わりました

評価指標はNDCGだったのですが、1位の方のスコアが0.277、私は0.194という順位以上の圧倒的大差・・・!

「いったいどうやったらword2vecでそんなスコアが出せるのか?(*2)」しばらく考えていましたが、まったく良い方法が思いつきません

私は、ここでようやく自分が何がわからないのかがわかっていないという事実に気づいたのです

hmdhmdは

・kaggleへの参加意欲(俺より強い奴に会いに行く・・・)

を手に入れた!

次回 ~第1章~ 激闘! Home Credit 編 に続く

*1 リクルート式 自然言語処理技術の適応事例紹介

*2 上位陣はそもそもword2vecを使っていませんでした

この記事が気に入ったらサポートをしてみませんか?