見出し画像

ラビットチャレンジ三日目:機械学習

前回からだいぶ時間が開いてしまったが、ちょっとずつ進めている。三日目という表現はあまり宜しくない気もするが、まあいいか。

ステージ2では機械学習の基本的な要素の学習となる。タスクの分類(教師あり・なし学習、回帰・分類)から始まり、線形・非線形回帰、ロジスティック回帰などが丁寧に説明されていた。おおよその内容は知っていたが、機械学習モデルを訓練・検証・適用するときの tips で知らない部分もあったのでかなり良い勉強となった。

今回の学習手順は、ビデオ視聴+要点の整理、ステージテスト、レポート作成、コード実装演習であった。ステージテストは、ビデオでは出てこなかった内容があったが(自分が見つけられなかっただけか?)、調べれば対処可能。むしろ自学習をしているかどうかをステージテストで見ているのかもしれない。
自身の理解を深めるために割とレポート作成に時間をかけた感はある。
勉強用のコードは提供されており、Google Colaboratory 上で動作させることが想定されている。私の場合は手元に環境があるのでそれを用いた。コード実装演習に関しては、後から自分が見返した時に各機械学習モデルの使い方と、前処理を適用する時の考え方が分かるように Jupyter Notebook を作成した。Numpy での実装と scikit-learn での実装があるが、ひとまずモードを使って分析することを目的として scikit-learn に実装されているモデルを使うこととした。もし実装演習レポートが戻ってきたら Numpy で実装しようと思う。

(2021/05/14 追記)
結局、レポート提出前に Numpy での実装も追加した。よく考えたら実装演習なのだから、すでに scikit-learn で実装されているものを利用するだけでは実装とは言えない。scikit-learn の方は分析の演習のために使用したという体裁にしてレポートを修正し、提出した。
レポート提出要領に「一つの URL での提出」とあるので、レポート作成手順は以下のようにした。
1. 要点を Markdown で作成し、pandoc で word に変換して体裁調整してから PDF に変換。
2. Numpy での実装演習を行った Jupyter Notebook のファイルを HTML に変換し、その後ブラウザ上で PDF に変換。
3. scikit-learn での分析演習を行った Jupyter Notebook のファイルも同様にして PDF に変換。
4. CubePDF Utility を使用して 3 つの PDF ファイルを結合。

Notebook ファイル一つを PDF に変換しただけでも 37 ページに達し、合計 90 ページ以上になったがまあいいだろう。要点は外していないはずなので、これで通らなかったらどうしようか。


この記事が気に入ったらサポートをしてみませんか?