~最終章~ 時は来た! 地震コンペ 編

(前回までのあらすじ)
hmdhmdは累計6枚の銀メダルを手に入れたが金色は混じっておらず、Twitterのプロフィールを「永遠のkaggle expert」に変更しようとしていたが・・・!?

そろそろ金メダルをくれても良いのでは・・・?と思いながら挑んだのは、LANL-Earthquake-Prediction(通称「地震コンペ」)でした。

地震が起きる前に断層のひずみなどで発せられた音響データをを元に、地震が何秒後に発生するかを予測するという内容です。

このコンペでは、PLAsTiCCの際に組ませていただいたcurrypurinさんと、再度チームマージさせていただきました

アプローチ

実際のところ、チームマージするまでは特に何もアイデアが思い浮かんでいませんでした。しかし、チームマージ後にdiscussionで「実は論文の中に、コンペのデータっぽいグラフがあるぞ?」という内容を見つけてから、事態は大きく動き始めました。

そしてどうやらリークらしいことがわかってきた後は、どうやればそのデータに寄せた予測ができるかを考え始めました。currypurinさんがslackで「トレーニングデータのtargetの値をを動かせば良さそう」というアイデアを投函したところから、道が拓けていきました。

最初は「targetを動かすとは・・・???」と思っていましたが、そもそも学習データが少なく、そのまま学習すると容易にオーバーフィットするため、合理的なことに気づきました。

あとはどのようにtargetを動かすかというところです。
2人の間でいくつかアイデアが出ましたが、いくつかの閾値でtrainデータをさらにtrain、testデータに分割して、testを予測した際にもっともMAEが下がるものを選ぶという方法で、数値を根拠に決めることができました。

そのためpublicLBは良くない結果を提出することになりましたが、すでにpublicLBを追うことに意義を感じていなかったため、これまでのコンペと同様にあまり気にしませんでした。

最後は、testがまったく違う出典だった場合は詰むという状況で、祈るような気持ちで結果発表を迎えました。

結果

結果を見て、非常に驚きました。4,540チーム中、まさかの3位(!)。
もはやリークしている時点でコンペとしての意義はどうなのかというところですが・・・なにはともあれ、hmdhmdは、無事にkaggle masterになることができたようです。

hmdhmdは、ついにkaggle masterの称号を手に入れた!

次回、~まとめ~ kaggle masterになるまでにやって良かった3つのこと

この記事が気に入ったらサポートをしてみませんか?