【分析】大学生でデータ分析と出会った話【python】
こんにちは!高校生の時から興味のある分野が見つからなかったもろ〜んです
データ分析ってどんなかんじ?
スタートはどんな感じなの?
データ分析に興味を持ち始めたあなたは、こんな疑問があると思います。
今回は、大学で出会ったデータ分析に惹かれて現在も勉強しているもろ〜んが、どのような手順を踏んでここまで来たのか執筆します。
ここまで、といっても学生奨励書で受賞されたレベルですけれどね。
-----------------------------------------------
大学3年の春 データ分析と出会う
私が所属している大学では、ゼミや研究室配属の前に体験教室のような講義がありました。
そこで私は、データ分析と出会いました。
初めは衝撃を受けました。多くのデータから法則を見つけモデルを作り、予測までできるのです。
情報化社会と言われる昨今、データの活用は新しい価値を生めるのでは?そう思い、後期から始まるゼミを選択しました。
この体験教室で行ったこと
私たちは、『パソコンメーカーは市場でどのように差別化を行っているのか』をテーマに進めていきました。
まず必要となるのは、①データの収集です。データがなければ、分析することはできません。初めは、コピー&ペーストでデータを集めていました。数100件集めるのも大変なくらいでしたね。
スクレイピングという技術をしってからは、数1,000件なんてあっという間に自動で集められるので、収集を自動化したい人は勉強してみてはいかがでしょうか?
次に必要になるのは、②分析ツール及び、プログラミング言語です。集めたデータを分析します。
おすすめのツールは、Exploratoryです。
あらゆることが、ちょう簡単にできます。データマイニングだけでなく、テキストマイニングもできるので、試しに分析してみたいなという方には、かなりおすすめできます。
プログラミング言語は、Rかpythonが鉄板です。
私は、Rはほとんど勉強したことはありません。基本的には、Rコマンダー(Rcmdr)というライブラリーを呼び出して使っていました。
データの型によるのでしょうか、データセットが表示されないことが多々ありました。そんなときは
editDataset(ファイル名)
と打つと、表示されると思います!
pythonはいっぱい記事や本があると思いますが、特に好きな記事はこちらです。
知らない分析手法は使えないので、ここで基本的にデータ分析で使う手法は扱われていると思うので一読をおすすめします。
pythonの本は買ったことないです笑
基本的に、Udemyというオンライン研修サービスを利用しています。
最後に、なんといっても③分析手法と統計学について学ぶ必要があります。
私が主に使っていた分析手法は、重回帰分析、主成分分析、クラスタリング、ロジスティック回帰、共起ネットワークくらいでしょうか。
この分析を使う上で、統計学は切っても切り離せません。
統計学は、この本で学びました。
絵や図で丁寧に説明されています。数式からグラフの形が想像できない人や、細かく丁寧に説明されている本を読みたい方には、おすすめします。
--------------------------------------------------------------------------------------
いかがでしたでしょうか?データ分析って実はツールを使えばとっても簡単で、何が難しいって数字に意味を与えることだと私は思います。
勿論そのためには、数値がどのように導出されたのかを理解していなければいけませんし、データの意味を知らなければいけません。
分析だけを学ぶことは簡単ですが、この数字に意味を与えるのは一度自身でデータを集めて、そのデータにどんな意味があって...と一連の流れを経験することが、データ分析者としての近道だと思います。
少しでも興味を持ってもらえた、少しでもイメージできた、もっとデータ分析について学んでみたくなったと感じていただけたら幸いです。
この記事が気に入ったらサポートをしてみませんか?