見出し画像

強化学習の勉強を始めました

こんにちは、えむしーじじょうのShikiです。

先週から細々と強化学習の勉強を始めました。

昔に、ダウンロードして環境を整えればすぐに動かせるような、とても有難いもので強化学習を遊んだことがあります。それはそれで面白かったのですが、そのプログラムでは用意された課題のパラメータを変える程度しかさわれず、自分で課題設定をできませんでした。

そこで今回、改めて強化学習を勉強しようと思い立ち、ネットで勉強。
ところがどっこい、分からない用語やコードのオンパレードでHPが0に。
これは基本からやらないとダメそうだな、と専門書を購入しました。

読んだおかげで、すぐに強化学習マスターに!とはいかず、今も悪戦苦闘中です^^;)
機械学習あるあるですが、環境構築だけでも一苦労です。

強化学習マスターになってから記事にする心積もりだったのですが、壁が高そうなのでモチベーション維持の意味も込めて、小出しにすることにしました。

次の動画が今日までの勉強の成果です^^)
エージェントは付属のプログラムを使用して、課題はオリジナルで作成しています。

この課題のポイントはゴール位置が毎回変わるところで、固定だとすぐに解いてしまうのですが、ランダムにすると途端に難易度が上がるようです。そうしてようやく条件の与え方を工夫する必要がでてきます。

これはまだフラットなフィールドですが、壁を作って迷路を解かせるのをひとつの目標にしています。課題がたくさん有り、いつ実現するか分かりませんが、少しづつでも進めて行くつもりです。

終わり。

記事が面白かった! 役に立った! 応援したい! という方にご支援頂ければ幸いです。