見出し画像

Gymで強化学習⑱Q学習:実装編

前回は、オンポリシーのTD学習法としてSARSAを実装しました。今回は、オフポリシーのTD学習法としてQ学習を実装します。

ここから先は

10,385字 / 2画像

キカベン・読み放題

¥1,000 / 月
初月無料
このメンバーシップの詳細

この記事が気に入ったらサポートをしてみませんか?