見出し画像

データサイエンス勉強記録⑧(5/15)

どうも。こんにちは。

ケミカルエンジニアのこーしです。
GWもあっという間に終わってしまい、再び残業続きの日々に戻ってきました。
GW後はあまり進捗が無かったため、今週はGWの勉強結果について書いていきます。

あと、今月から忙しくなってくるため、勉強記録の更新は1ヶ月おき程度にペースダウンしたいと思います汗

今週の勉強記録

GWの勉強成果は下記の通りです!

  1. 「スモールデータ解析と機械学習」読了!

  2. 「これなら分かる応用数学教室」5、6章読了

  3. マンガでわかるデータベース 読了!

1.スモールデータ解析と機械学習

「スモールデータ解析と機械学習」を読了しました!
バギングやブースティングといったアンサンブル学習やPyTorchを用いたオートエンコーダの実装など、初めて学ぶ内容が多く、とても楽しく勉強できました。

後半は内容が難しく、Pythonコードを追うのも大変でしたが、実務で役に立つ内容なので、しっかり復習したいと思います。

下記については、scikit-learn等のライブラリを駆使し、実務でも多用していましたが、本書ではnumpyのみで計算する方法を学ぶことができ、計算の中身まで理解できるようになりました。

  1. 主成分分析(主成分回帰)

  2. PLS

  3. Lasso回帰

  4. クロスバリデーション

  5. RMSEによる性能評価

一方、本書で新たに学び、今後実務で使っていきたい内容は下記の通りです。

  1. 入力変数選択(VIP法、NCSC-VS)

  2. 異常検知( MSPC、AE)
    ※MSPC:多変量統計的プロセス管理
    ※AE:オートエンコーダ

理論もコーディングもまだマスターしたとは言いがたいレベルなので、ブログ等にまとめながら復習していきたいと思います。


2.これなら分かる応用数学教室

復習しておいた方がよさそうな5,6章に絞って学習しました。

特異値分解の説明はとてもわかりやすかったのですが、他の内容については、紙面をたくさん使って解説している「意味がわかる線形代数」の方がわかりやすかったです。

初学者は「意味がわかる線形代数」で基礎(固有値や2次形式など)を固めた方が良いと思います。


3.マンガでわかるデータベース

サクッと概要をつかむために読みました。
アルゴリズムやSQLの部分は、全然理解が足りてないと思われるため、下記の書籍を積ん読に追加しました。

統計検定1級に挑戦した後、時間が取れたら勉強していきたいと思っています。(ただし、実務で必要になったらその都度勉強します。)

今後の勉強計画

ソフトセンサー(回帰分析)

下記4冊を読んで、ソフトセンサーの構築•改造のためのを知識を増やしたいと思います。

金子先生のブログ(私の学習の道しるべです。)では、「ガウス過程回帰」が紹介されており、 一般的に使われているPLSより強力ということで、理論を理解しておきたいなと考えています。

また、回帰分析の結果を解釈できないと実務では使い勝手が良くないため、解釈する技術も学びたいと思います(特にSHAP)。
金子先生もこちらの論文で解釈性について研究されています。


異常検知

大型の化学プラントでは、機器故障による損失(数千万〜数億円)が毎年と言ってよいほど多く発生しています。

できることなら、機器が故障する「前兆」を見つけ(異常検知)、損失を回避したいと考えています。
データから経時の劣化状況を見える化し、優先順位をつけてメンテナンス(補修、交換)していくのが理想ですね。

理論を学びつつ、実装もできるようにPythonやRのコードが載っている教科書を学んでいきたいと考えています(積ん読中)。

統計検定1級(数理統計学)

11月の試験に向けて、そろそろ勉強を始めていかないといけません。
確率統計キャンパスゼミ、統計検定1級公式テキスト、現代数理統計学の基礎あたりを読破していきたいと思います!


データベース

統計検定1級が終わったら勉強を始める予定です。
会社では、専門の技術者がいるので、とりあえず統計検定1級に注力ですね。。

基本情報技術者?

データベースやネットワークを学習するなら、ついでに資格も取ってしまおうかと画策してます。
非専門分野を学ぶ際は、資格勉強を通じて基礎を固めるのはアリだと思ってます(受けるかどうかは、じっくり悩みますが)。


今月から少し忙しくなるので、勉強のペースが落ちてしまうかもしれませんが、引き続きコツコツ勉強したいと思います。

それでは、また来月お会いしましょう!

この記事が気に入ったらサポートをしてみませんか?