ロボット制御

本

運営しているクリエイター: Mikami.Hidenori

2019年10月3日 07:35

強化学習の学習アルゴリズムの分類

「強化学習」の学習アルゴリズムの分類方法である「モデルベース / モデルフリー」と「オンポリシー / オフポリシー」を軽くまとめます。

1. モデルベース / モデルフリー「強化学習アルゴリズム」の最も重要な分類方法の1つは、エージェントが「環境モデル」を使用する(または学習できる)かどうかです。「環境モデル」は、状態遷移と報酬を予測する関数を意味します。環境モデルを使用するアルゴリズムを「モデ

もっとみる

ロボット制御

フォローしませんか？

2019年10月の記事一覧

強化学習の学習アルゴリズムの分類