見出し画像

Gymで強化学習㊴REINFORCE:実践編①

前回は、REINFORCEの理論的な側面を解説しました。今回は、REINFORCEの実装をし、Gym環境であるCartPoleを使って実験します。

また、単純なベースラインを導入して、ベースラインがある無しで訓練の安定性やテスト結果にどのような差が出るかを確認します。

では、さっそく始めましょう。


ここから先は

20,376字 / 2画像

キカベン・読み放題

¥1,000 / 月
初月無料
このメンバーシップの詳細

この記事が気に入ったらサポートをしてみませんか?