![見出し画像](https://assets.st-note.com/production/uploads/images/122683749/rectangle_large_type_2_ef5c2ff97427115bb1dbd5420478e5d2.png?width=800)
Kaggleで銅・銀・金メダルを取るプロセス
Kaggleで銅メダル、銀メダル、金メダルを取るプロセスの違いや、具体的に何をすべきかについて質問がありました。
Twitterで回答を募集したところ、次の回答をもらいました。
過去に似たコンペ2,3コンペ漁って1~10位までの解法に目を通しつつ、現コンペのディスカッションを全部追って効くものを試すと銀メダルは取れるという肌感覚 https://t.co/si4GwbM4wD
— 杏仁まぜそば (@an_nindouph) November 17, 2023
自分もこれと同じ感覚です。以下、少し説明します。
銀メダルを取るために必要なもの
銀メダルを獲得するために必要だと思ったのが、次の3つです。
最低限のデータ分析コンペの実力
データ分析について、最低限のみんなが知っていることを知っておくことが必要と言えます。「Kaggleで勝つデータ分析の技術」の知識があれば、十分に戦えると思います。この本の紹介文では次の記載があります。
そこでこれらのテクニックや事例を多くの人に知っていただくために、現時点で最新のものを整理して本書にまとめました。特徴量の作り方、バリデーション、パラメータチューニングなどについて、一般的な書籍ではあまり言及されない暗黙知やポイントについて記述しています。分析コンペにこれから参加してみたい方、あるいはもっと上を目指したい方だけでなく、実務で予測モデルの精度を上げたいという方にも参考になる情報が多いでしょう。
私も次のnoteを書いています。
そのコンペに関連する知識
次に、メダルを取るためにはそのコンペに特化した知見が必要になります。画像コンペなら画像コンペの知識、NLPならNLPコンペの知識、推薦なら推薦のコンペの知識のように。その知識を得るためには、直近の過去のコンペ類似コンペのsolutionを学ぶのが良いと思います。
過去コンペのリーダーボードのところにsolutionへのリンクがあるので、上から順に見ると良いでしょう。
![](https://assets.st-note.com/img/1700960253681-M9m3SvBc3f.png?width=800)
どれが関連するコンペかは、Discussionにトピックが作られることが多いです。ない場合は、自分でたてて聞いてみましょう。
現在のコンペの知識
Kaggleでは、コンペ期間中もDiscussionやNotebookで情報のやり取りがされるので、情報の面で負けないためにそれになるべく目を通します。Discussionの内容をメールで受信するようにしておけば、それほど大変ではないと思います。
その他の取り組み方は、次のnoteをどうぞ。
この3つをやれるだけの時間を投入すれば、期待値として銀メダルは取れると思います。
金メダル
金メダルは運も絡むので、こうすれば絶対取れるというのはまだわかりません。
これなので、銀メダル獲得については時間を投入できるかどうか、モチベを上げられるかというところになるんだとおもう。
— カレーちゃん🍮 (@currypurin) November 17, 2023
金メダルは実力か運か多様性が必要なので、とりあえず銀のsolutionを持って、チームマージがよい https://t.co/J3P8PZjICl
ただ、金メダルには実力 or 運 or 多様性が必要です。
多様性は、チームマージで得ることができるので、銀メダルを取れるようになったら、チームマージをしてしまうのが金メダルを取る一番の近道だと思います。
まとめ
この記事では、質問に答えてみました。
質問はマシュマロで募集していますので、ぜひ質問してください。
コメントお待ちしています。匿名の質問はマシュマロから→https://marshmallow-qa.com/currypurin