データサイエンティスト養成講座

日本で自称データサイエンティストと言うのが増えているが、以下のタイプが多い気がする。

1)大学の統計確率を教えていた先生が、急にデータサイエンティストを養成しろと言われて、講義をしている。大抵はプログラムが書けないし、最先端の深層学習の論文などは読んだことがなく、古典的な統計を教えている。

2)企業で上司命令で勉強しながら簡単なプロジェクトをやった経験がある。例えば、推奨システムを作れと言われて、似た商品を提示するプログラムを作ったことがある。(ユーザーごとに異なる推奨をする日本のサイトはみたことがない。)

3)部下に命令して(もしくは他社に丸投げして)プロジェクトをやった経験がある。ただし,やった中身の理論については,聞きかじっただけなので,全然理解していない.

4)深層学習の例題を、パッケージをインストールして、動かしたことがある。しかもそれをあたかも自分がやったかのように本を書いたり、ブログで公開したり、セミナーをしたりしている。

本当に機械学習、深層学習、強化学習を理解して、仕事に使おうと思ったら、多少勉強する必要がある。学生や企業の方に推奨しているのは以下の講義を順に見ることだ。(全て無料です。)

追記:会社をAI化してほしいと頼まれたなら,Andrewの新しい講義を見るべきだ.courseraでai for everyone(みんなのAI:-) というのが3/1から始まった.

中身は,最近彼が書いた本(メルマガ)の内容で,基本から組織やプロジェクトをどうするかということを,彼の経験(Googleと百度)から語ってくれる.学生にはよくわからないかもしれないが,これからAIーというか深層学習ーからみの仕事をしたい日本の会社の人たちは参考になると思う.

CourseraのNgの機械学習
https://www.coursera.org/learn/machine-learning
MATLABを練習問題に使っているので、プログラムはしなくてもよいが、基礎理論をこれで勉強する。

CourseraのNgの深層学習
https://www.coursera.org/specializations/deep-learning
5つの連続講義で深層学習の基本を勉強する。Pythonで自分で書いて見ることをお勧めするが、実際に仕事に使うときにはkerasやcaffe2(研究するならPyTorch)をお勧めする。

Stanfordの深層学習の連続講義
https://www.youtube.com/playlist?list=PL3FW7Lu3i5JvHM8ljYj-zLfQRF3EO8sYv
2017年度の講義。受講者が700名を超えて教室に入りきらないのでyoutubeにアップしたようだ。

Silverの強化学習のビデオ
https://github.com/dalmia/David-Silver-Reinforcement-learning
強化学習についてはこちらが詳しい。現役で最先端を走る専門家の講義はわかりやすい。

推奨システムについてはよい無料講義が見つからない。誰か知っていたら教えてください。

追記:推奨システム(というか協調フィルタリング)の無料講義を探していたら,fast.ai のLesson 5 中にあることに気づいた.
https://course.fast.ai/index.html

fast.aiは講義が2時間でだらだらなのと,インストールにGPU+linuxの環境(というかお奨めは有料のクラウド)を強制するので敬遠していたが,最先端を簡単に試せるという意味ではお奨めだ.元になっているのはPyTorchで,それに講義用のラッパー(fast.ai)をかましている.これを使うと,Kerasより簡単に書けるので,誰でも(お金さえあれば:-) 深層学習ができる.企業の方にはこれが最も良いかもしれない,

追記:新しいfastaiのDL講義が始まったようだ.無料のGPU付きクラウドGoogle Colabでも動くようなので,学生にもこれを推奨する.

追記:kaggleでも同じGPU付きのクラウドが配布された.ここから入れる.

この記事が気に入ったらサポートをしてみませんか?