Kaggleやってみました@弱小ボカロP #Granvalley

どうも、グランバレイ社員兼弱小ボカロPのGDTY@GVです。
今回は我々グランバレイの社員が自己研鑽や腕試し、はたまた賞金狙い?のため取り組んでいるKaggleを取り上げたいと思います。
本記事はKaggleというワードは知っているが、実際に参加したことがない、どういうものかわからない、といった方を対象としています。特に、参加したいが一歩踏み出せないといった方の背中を押せることができたらと思い、本記事を作成しました。Kaggleの概要と私自身がKaggleをやってみて感じたことがメインのため、具体的なKaggleの登録方法やコンペティションの参加方法などは割愛しております。

グランバレイにおけるKaggleの取り組み

Kaggleとは世界最大の機械学習のコンペティションサイトです。
現在、我々グランバレイでは社員数名がKaggleのいくつかのコンペティションに参加し、機械学習モデルの精度を競い合っています。最近は、「Santander Customer Transaction Prediction」というコンペティションに2名が参加し、2名ともシルバーメダルを取得しました。Kaggleに参加することによって、日々、機械学習の勉強を楽しみながら(苦しみながら)やっています。また、Kaggleで得られた知見などは、社内の勉強会で共有したりしています。社内の打ち合わせでも、Kaggleの結果どう?結果をミーティングで発表しない?といった会話が時々とんだりします。

「自分の実力を試せる」Kaggleとは

Kaggleは機械学習のコンペティションサイトで、分類問題や回帰問題、画像処理、自然言語処理など、様々な課題が提示され、世界中のデータサイエンティストがその課題に対する機械学習モデルの精度を競い合っています。データサイエンティストの中には、個人だけでなくチームや組織で取り組んでいるところもあります。最近では、率先してKaggleに参加を推奨している企業もあります。グランバレイは、仕事に差し支えがなければ業務中に取り組んでもOKなので、私も業務に余裕があれば参加しています。

Kaggleになぜ参加するのか?

なぜ世界中のデータサイエンティストがKaggleに参加し、競い合うのでしょうか?
考えられる理由は、以下ではないかと思います。

 ・自分の実力を世界レベルで試すことができる
 ・様々な課題を通して自身のスキルアップにつなげることができる
 ・名声となる「メダル」がもらえる
 ・成績上位者には賞金がでる

自分の実力を世界レベルで試すことができる
日々の業務の中では、自分の実力がデータサイエンティストとして、どれくらいあるものなのか、ということを把握することは難しいです。Kaggleでの実績=データサイエンティストの実力、ではないですが、少なくとも、自分の実力を測る一尺度として、Kaggleでの実績というのは使えると思っています。

様々な課題を通して自身のスキルアップにつなげることができる
Kaggleには様々な種類の課題(分類、異常検知、画像処理、音声処理など)があります。様々な課題を解く中で、業務では得られない経験やスキルアップができると思います。

名声となる「メダル」がもらえる
Kaggleでは上位の成績を残したり、良いソースコードを共有したり、良いディスカッションをするとメダルがもらえます。このメダルがデータサイエンティストの一つのステータスとなっているため、多くのデータサイエンティストがしのぎを削ってKaggleにサブミット(回答の提出)を行っています。

成績上位者には賞金がでる
Kaggleで出される課題の多くは、機械学習を使って何か問題を解決したいと考える企業です。企業はKaggleという場所を使って、世界中のデータサイエンティストに機械学習モデルを作ってもらい、その対価として賞金を支払うという構造になっています。そのため、コンペティションによっては成績上位者に賞金がでるものもあります。

Kaggleに参加してみて感じたこと

私がKaggleに参加してみて感じたことは、「初心者でも参加できるが、上位を取るためには知識とアイデアが必要」ということです。Kaggleでは参加者同士がディスカッションをしたり、ソースコードを共有したりすることができます。共有されたソースコードなどを参考にすることで、初心者の方でも意外と簡単に機械学習モデルの構築や解答の提出ができてしまいます。ただし、精度をアップさせるためには、ソースコードを理解し、自分なりにアレンジしなければいけません。そのためには、機械学習の知識が必要になってきます。さらに上位を狙うとなると、知識だけではなくアイデアも必要です。他人と同じやり方では、他人と同じような精度しかでないため、いかに独自のアイデアを加えるかというのが、上位を狙うためには重要であると感じています。そして、そのアイデアを考える時間が、私は最も楽しいと感じました。

まとめ

Kaggleという機械学習のコンペティションサイトでは、世界中のデータサイエンティストが参加しています。そこでは、機械学習モデルの精度の競争だけでなく、ソースコードの共有やディスカッションが行われています。データサイエンティストの人はもちろんのこと、機械学習に興味がある、仕事にしてみたい、という方でも是非勉強になると思うので、Kaggleをのぞいてみてください。

今度は「機械学習と音楽」について語りたいと思います。
最後までお読みいただきありがとうございました。


いいなと思ったら応援しよう!