見出し画像

データサイエンス勉強記録①(3/21)

どうも。こんにちは。

すでに3月の残業時間が40時間超えのこーしです。
ここ半年くらいは、仕事が忙しく休日しか勉強できてない日々が続いています。

毎日コツコツ継続して勉強したいところですが、なかなか上手いこといきませんね。。。

今週は、線形代数、主成分分析、Pythonの勉強をしました!
具体的には下記の通りです。

  • 意味がわかる線形代数 ⇒ 通読(読了!)

  • Udemy「【世界で18万人が受講】実線Pythonデータサイエンス」⇒セクション6まで

  • 化学のためのPythonによるデータ解析・機械学習入門 ⇒ 4章PLSまで

線形代数の復習

実務で扱うデータは多変量データなので、ベクトルや行列表記に慣れる必要があります。
データ解析の第一歩と言っても過言ではない「主成分分析」は線形代数の知識が必要不可欠です。

そこで、「意味がわかる線形代数」を通読することにしました。
工学での応用を見据えた構成になっているので、非常にオススメです。

  1. 線形空間と基底線形変換

  2. 基底の取替え

  3. 固有値・固有ベクトル

  4. 行列の対角化

特に「5章 対角化の意味」のコラムに書いてある主成分分析の解説はとてもわかりやすかったです。
(もちろん、初見では理解できませんでしたが。。)


Python学習

最近はPythonを使って、ヒストグラム作ったり、グラフを一気に作成するのはもちろん、主成分分析や回帰分析(主にPLS)も行っています。

そこで、新たな知識を取り入れるために、ひたすらUdemyを見つつ、実務で使えそうなコードを探しています。

これまでデータサイエンスに特化してPythonを勉強してきたので、データ解析のコードならスラスラと読みこなせるようにもなりました。

そろそろ、初心者向けにPythonブログを書こうかなと考えています。


実務向け学習

統計学とpythonを使って、ソフトセンサーを構築したり、異常検知ができるようになりたいと考えています。

化学系のデータ解析の教科書としては、金子先生の本が有名ですね。

今週は下記について学びました。

  • 主成分分析

  • クラスター分析

統計検定準1級対策で勉強した内容だったので、割とスラスラ読めました。
よい復習になったと思います。

統計検定準1級を取得した効果がはっきりとわかり、とても嬉しいです。

統計検定準1級の合格体験談はコチラ↓↓


勉強を頑張ったご褒美に下記の教科書も購入しました。

目次を見て、PLSについて手厚く解説されてそうだなと思い購入を決めました。
著者紹介で藤原先生が化学工学専攻だったことを知り、なおさら親近感が湧きました。

内容もプロセスエンジニア寄りだとわかったので、早く読みたくてウズウズしています。

今後の勉強方針

引き続き、金子先生の「化学のためのPythonによるデータ解析・機械学習入門」を読んでいきます。

また、線形代数の復習としては、「統計学のための数学入門30講」を復習したいと思います。

こちらは、公式をまとめたような内容なので、理解していない項目は無いかチェックする意味合いです。

あと、もし時間があれば藤原先生の「スモールデータ解析と機械学習」を進めたいと思います!

それでは、また来週!


2022年のデータサイエンス勉強方針はコチラ↓↓


この記事が気に入ったらサポートをしてみませんか?