マガジンのカバー画像

強化学習入門

109
強化学習関連のノートをまとめました。
運営しているクリエイター

2019年10月の記事一覧

WindowsでOpneAI GymとStable BaselinesとGym Retroを実行する

「OpenAI Gym」と「Stable Baselines」と「Gym Retro」のWindowsへのインストール方法をまとめ…

npaka
4年前
5

Stable Baselines チュートリアル(5) / カスタムGym環境の作成

以下のColabが面白かったので、ざっくり訳してみました。 ・Stable Baselines Tutorial - Cre…

npaka
4年前
5

Stable Baselines チュートリアル(4) / コールバックとハイパーパラメータの調整

以下のColabが面白かったので、ざっくり訳してみました。 ・Stable Baselines Tutorial - Cal…

npaka
4年前
3

Stable Baselines チュートリアル(3) / 環境のマルチプロセッシング

以下のColabが面白かったので、ざっくり訳してみました。 ・Stable Baselines Tutorial - Mul…

npaka
4年前
7

Stable Baselines チュートリアル(2) / Gymラッパー、モデルの保存と読み込み

以下のColabが面白かったので、ざっくり訳してみました。・Stable Baselines Tutorial - Gym w…

npaka
4年前
4

Stable Baselines チュートリアル(1) / Getting Started

以下のColabが面白かったので、ざっくり訳してみました。 ・Stable Baselines Tutorial - Get…

npaka
4年前
5

SimPLe : Atariゲームのモデルベースの強化学習

以下の記事が面白かったので、ざっくり訳してみました。 ・Simulated Policy Learning in Video Models 1. はじめに「深層強化学習」は、視覚的な入力から複雑なタスクのポリシーを学習するために使用でき、Atariゲームで大きな成功を収めています。しかし、多くの最先端のアプローチには、『環境との非常に多くの対話が必要』という制限があります。人間が学習するために必要な対話よりもはるかに多くの対話が必要になります。 人々がこれらのタスクを効

PPO : OpenAIのデフォルトの強化学習アルゴリズム

以下の記事が面白かったので、ざっくり訳してみました。 ・Proximal Policy Optimization 1.…

npaka
4年前
6

DQN & Double Q-Learning & Prioritized Replay & Dueling DQN : DQNな強化学習アルゴ…

以下の記事が面白かったので、ざっくり訳してみました。 ・OpenAI Baselines: DQN 1. はじめ…

npaka
4年前
6

ACKTR & A2C : Actor-Criticな強化学習アルゴリズム

以下の記事が面白かったので、ざっくり訳してみました。 ・OpenAI Baselines: ACKTR & A2C 1…

npaka
4年前
4

World Model : 夢の中で学ぶ強化学習アルゴリズム

1. 強化学習の問題「強化学習」は、「エージェント」が「環境」の「状態」に応じてどのように…

npaka
4年前
12

HER : 失敗から学ぶ強化学習アルゴリズム

以下の記事が面白かったので、ざっくり訳してみました。 ・Ingredients for Robotics Researc…

npaka
4年前
21

PyBullet Robotics Environments

1. PyBullet Robotics Environments「PyBullet Robotics Environments」は、MuJoCo環境に似た3…

npaka
4年前
6

MarLÖ : マインクラフトの強化学習環境

1. MarLÖ 「MarLÖ」は、マインクラフトの強化学習環境です。金の鉱石を発見する、Mobを捕まえるなどの、マインクラフトに関するタスクに挑戦します。OpenAI GymのGymインタフェースを利用して学習させることができます。 2. MarLÖのタスク◎MarLo-MazeRunner-v0 【説明】 迷路を抜けてレッドストーンの柱への到達するタスクです。 【観察】 エージェントが使用する深度マップが提供されます。これにより、このタスクが簡単になります。 【行