特別講義 弐拾壱:データサイエンスコンペに参戦!
高まり続けているデータサイエンスへの期待。一方で実際に動かしたことがないからどんなことができるかあまりよくわかっていない人は多いだろう。
ぱっと見、何かしらすごいことをやっているんだなと思って、スッと身を引いてしまうがそれはもったいない。昔は入門にあたってもかなり専門的な知識が求められ(最終的に必要なのは今でもそうだが)、様々なサポートも英語がほとんど、しかもプログラムの流用やライブラリも少なかった。しかし、今ではかなり充実してきている。
そう、言い訳する時間は終わったのだ。
今回は、データサイエンスに興味があり、まずは挑戦したい人に向けて、Kaggleというデータ分析コンペのプラットフォームサイトを題材にどう学んでいくか紹介していく。
Kaggleは数多くの企業がデータ分析・予想のコンペを開いているサイトだ。データサイエンティストはコンペに参加して良い分析・予想を提出し、上位には賞金が与えられることもある。実力を競い合う場ではあるのだが、それぞれが学び合うこともできる場となっており、また、プログラムを書くための環境も用意されているので、かなりオススメしている。
最高の頭脳が集まるサイトでどう学んでいくか、読んで理解してほしい。
目次は以下の通りだ。
Kaggleにログイン
コンペを選ぶ(選び方)
初サブミット(提出)
データを分析してみる
データの前処理
機械学習モデルを使ってみる
他の人の解き方を学ぶ
それでは行こう!
ここから先は
12,255字
/
42画像
¥ 2,022
この記事が気に入ったらサポートをしてみませんか?