マガジンのカバー画像

ロボット制御

2
運営しているクリエイター

記事一覧

強化学習の学習アルゴリズムの分類

強化学習の学習アルゴリズムの分類

「強化学習」の学習アルゴリズムの分類方法である「モデルベース / モデルフリー」と「オンポリシー / オフポリシー」を軽くまとめます。

1. モデルベース / モデルフリー「強化学習アルゴリズム」の最も重要な分類方法の1つは、エージェントが「環境モデル」を使用する(または学習できる)かどうかです。「環境モデル」は、状態遷移と報酬を予測する関数を意味します。環境モデルを使用するアルゴリズムを「モデ

もっとみる
ロボット開発のオープンイノベーションを狙う ROSを概観

ロボット開発のオープンイノベーションを狙う ROSを概観

先日、ロボットの動作制御の基本中の基本である、 PID Controller を解説しました。

今後は、ロボット関連の記事も色々書いていこうと思います。AIの普及とともに、ロボット技術の可能性はますます高まっています。COVID-19 の世界的拡大を受けて、できる限りあらゆる工程が無人化されていくことも予想されることもあわせ、産業の垣根を越え、ロボットを活用してシームレスなサービスを実現していく

もっとみる