マガジンのカバー画像

ロボット制御

2
運営しているクリエイター

2019年10月の記事一覧

強化学習の学習アルゴリズムの分類

強化学習の学習アルゴリズムの分類

「強化学習」の学習アルゴリズムの分類方法である「モデルベース / モデルフリー」と「オンポリシー / オフポリシー」を軽くまとめます。

1. モデルベース / モデルフリー「強化学習アルゴリズム」の最も重要な分類方法の1つは、エージェントが「環境モデル」を使用する(または学習できる)かどうかです。「環境モデル」は、状態遷移と報酬を予測する関数を意味します。環境モデルを使用するアルゴリズムを「モデ

もっとみる