見出し画像

データサイエンス入門②【やりたいこと編】

どうもこんにちは!こーしです(@mimikousi

本noteでは、ブログ(雷電風雨のエンジニア)には書いていない勉強の軌跡(というより試行錯誤)を残していきたいと思います。


前回に引き続き、データサイエンス入門について語っていきたいと思います。

前回の記事で紹介したUdemy講座でPythonを勉強することで、データサイエンスへの足掛かりができました。(絶対勘違いですが)

【受講した講座】
①【1日で習得】技術者のためのPythonデータ分析
②【ゼロから始めるデータ分析】 ビジネスケースで学ぶPythonデータサイエンス入門

特に、②はSIGNATEでのコンペティション(データ分析の課題をみんなで解いて、結果を競い合う。Kaggleの日本版のようなもの)のやり方も学べるので、今後、KaggleやSIGNATEでコンペティションをやりたい人にもオススメ講座です。

上記のUdemy講座でPythonの文法を学び、講師が行ったデータ分析をマネすることで、「データ分析はこうやってやるのだ!」というイメージはつかむことができました。

しかし、ここでやっと気づくのです。

「はたして、Python使って具体的に何がしたいのさ?」と。

プログラミングを学ぶときは、”具体的に”何がしたいのかを明確にしてから臨むべきですね。確実に挫折しますし、時間の無駄です。

私の場合、「データ分析がしたい」と思っていましたが、甘かったです。
「データ分析がしたい」と漠然と考えていただけでは、実際にできるようになりませんでした。

Pythonでやりたいことをしっかり書き出しながら考え、自分なりのロードマップを作らないといけないことに気づきました。(独学ならではの悩みなのかもしれません。)

プログラミングスクールに入ったら、ある程度のレベルまではカリキュラム通りに進めていけば身につくので、良い意味でも悪い意味でも、「自分が何をしたいのか」について考えなくても良いのかもしれません。

画像1

なので、無い頭を一生懸命振り絞って考えてみました。

<Python使ってやりたいこと>
①製造データの見える化ツール(Webアプリ)の作成
トレンドデータ(PV,MV,SV)や品質データ(相関係数、散布図)のグラフをサクッと一瞬で表示する。
Excelで1個ずつグラフを作成していると、それだけで日が暮れるので、Pythonで自動化したいと考えました。
できれば、下記のような機能もつけたいですね。
・マウスでドラッグしたら、その部分が拡大できる
・レンジを自動で調整してくれる(上限、下限、目盛り幅を手動でも入力可能)
・標準偏差、平均値、中央値、±○σのラインの自動表示

②機械学習による品質予測
ソフトセンサー」を作成して、品質予測をしたいです。
重回帰の説明変数(x)の選択を機械学習でやってみたいなと思っています。

③ブログの検索順位チェックツール作成
これは、ブログやってて思ったのですが、市販のブログ検索順位チェックツールは年間1万円強の費用がかかるので、自分でツールが作れたらよいなと思います。

④Twitter投稿の解析
狙いは「バズ」です。
一度くらいは「バズ」らせたいじゃないですか。
理由は以上です。


やりたいことがほんの少しだけ明確になった気がします。

地道にPythonの勉強(というかエラーとの戦い)を継続し、かつ統計学や機械学習・強化学習・深層学習あたりを勉強する必要があるなと無い頭で考えました。

ネットで評判の良い本をいくつか買ってPythonを学びつつ、まずは統計学を勉強しようと決意しました。

次回からは、統計学の勉強の軌跡(試行錯誤)について書いていきたいと思います。

続く

いいなと思ったら応援しよう!