見出し画像

強化学習がやりたい! OpenAI Gym、DQNってなんや?

こんにちは!

ぷもんです。


前回、クラスタ分析(K-means法)を実行する!
というnoteを書きました。

前回までで、機械学習のうち
教師あり学習の分析と回帰、教師なし学習のクラスタ分析
をやってみて軽くですが理解することができました。


今回からは強化学習をやっていきます。

やり方を早く見つけることができたので教師あり学習から始めましたが
僕は強化学習が一番興味があったので楽しみです。

強化学習とは試行錯誤しながら価値が最大化する行動を学習するものです。
AlphaGoなどが強化学習を利用した例として有名です。


教師あり学習の分析と回帰、教師なし学習のクラスタ分析は
アヤメのデータセットやボストンの住宅価格のデータセットを使いました。
データがないとできなかったので
強化学習も同じなのかなと思っていました。

少し調べてみると
強化学習はデータよりも学習する環境
ゲームなどがの方が重要だという点で大きく違うようです。
(軽く調べただけなのでさらに詳しく調べてみます...。)

今まで教師あり学習、教師なし学習は
ANACONDA NAVIGATORとJupyter Notebookを使って
scikit-learnを利用しながら進めていましたが
やり方が変わりそうです。


思っていた以上に強化学習が
教師あり学習、教師なし学習と違いが大きそうで
少し混乱してきたので情報を整理したいと思います。


強化学習に関係が深そうな用語として気になった
OpenAI Gym、DQNについて書きます。


・OpenAI Gym

OpenAI Gymとは
非営利団体であるOpenAIが提供している強化学習用のツールキットです。
インベーダー、パックマン、アステロイド、ボードゲーム、歩き方のシミュレーション、車の山登り、倒立振子など色々なの環境(ゲーム)が用意されています。

教師あり学習や、教師なし学習で使ったscikit-learnのような
強化学習を学びやすいように環境をまとめてくれたもの
だとぷもんは理解しました!


・DQN

Q-Learningという強化学習の手法に
Deep Learningを組み合わせた「Deep Q-Network」を略してDQNと言います。

Q-Learningなどは実際にやっていきながら
具体的にどういうものなのかを理解していこうと思います。


なんとなくどういうものかがわかって
次何をすればいいのかがなんとなくわかったので
次回から強化学習を実際にやってみたいと思います。


参考にしたサイトはこちらです!


最後まで読んでいただきありがとうございました。

ぷもんでした!

noteを日々投稿してます! もしいいなと思ってもらえたら サポートしてもらえるとありがたいです。 VRやパソコンの設備投資に使わせていただきます。 ご意見、質問等ありましたらコメントください。 #ぷもん でつぶやいてもらえると励みになります。 一緒に頑張りましょう!