Courseraのデータサイエンス専門講座を受けた感想その5

Courseraのデータサイエンス講座の7、8、9、10コース目を受講し、全て完了させました。前回のコースの受講感想はこちらになります。

Regression Models

 7コース目は回帰モデル全般を学習しました。多変量回帰から線型モデル、ロジスティック回帰、ポアソン回帰について学ぶことができました。特に多変量回帰と線型モデルは残差評価とモデルに対する調整方法を詳しく知ることができます。残差による回帰モデルの評価はあまり触れられない話題ですが、この残差について散布図を作ることで視覚的に判断できるのを知ることができるのが良かった点だと思います。

Practical Machine Learning

 8コース目は機械学習の練習でした。機械学習は多岐にわたる分野なので、このコースだけでは一部分しか学ぶことができませんが、機械学習による推論の評価や交差検証によるモデルの性能をよくする方法を学べました。
 このコースでは一般化線型モデル、決定木、ランダムフォレストによる予測モデルの作りかたが紹介されます。また、教師なし学習も少しだけですが紹介されます。機械学習の導入としては良かったと思います。

Developing Data Products

 9コース目はデータプロダクトの開発法です。こちらはデータサイエンスの説明というよりもデータ分析や機械学習モデルの開発の流れの紹介と一般公開の仕方を説明する内容でした。
 このコースでは課題としてRmarkdownやknitrでプレゼンテーションやPDFを作成し、Rpubsで公開することが必要になりますので、その環境(Latexなど)を整えるほうが大変だったと思います。また、機械学習やデータ分析ではshinyというものを使ってアプリを公開する課題もありますので、事前にアカウントの設定をしておくとスムーズに課題に進めると思います。

Data Science Capstone

 最終コースは今までで学習したことを活かして一つのアプリを作るのが課題でした。注意点として、このコースを始めるには1~9までのコースで課題をすべて合格させないと受講できません。なので、このコースだけ合格して修了ということはできません。
 課題は自然言語処理とそれを使った予測モデルを作ることなので、今までの課題と比べても難易度が高く、本講座で学んだ知識だけではうまくいかないので大変なものだったと思いました。
 自然言語処理全般の知識は以下のリンクを参考にするといいかと思います。

https://web.stanford.edu/~jurafsky/NLPCourseraSlides.html

まとめ

 こちらを受講して、統計学や評価手法、機械学習の基本的な考え方を学ぶことができたと思います。ですが、このコースだけではデータサイエンスとしては初歩的な内容だった思います。なので、この講座をすべて終えたとしてもまだまだ学ぶべきことが多いと思います。
 ですが、データサイエンスのとっかかりや仕事でデータ分析をやっているが体系的には学びたいという人にはお勧めできる内容だったと思います。
 一部の講義は公開されていますので、受講する際はこちらをみて判断するといいかと思います。なお、このコースはすべて英語で、課題も英文で書く必要がありますので、英語ができないという方にはおすすめできません。



この記事が気に入ったらサポートをしてみませんか?