強化学習入門

WindowsでOpneAI GymとStable BaselinesとGym Retroを実行する

「OpenAI Gym」と「Stable Baselines」と「Gym Retro」のWindowsへのインストール方法をまとめ…

npaka

5年前

5

Stable Baselines チュートリアル(5) / カスタムGym環境の作成

以下のColabが面白かったので、ざっくり訳してみました。・Stable Baselines Tutorial - Cre…

npaka

5年前

5

Stable Baselines チュートリアル(4) / コールバックとハイパーパラメータの調整

以下のColabが面白かったので、ざっくり訳してみました。・Stable Baselines Tutorial - Cal…

npaka

5年前

4

Stable Baselines チュートリアル(3) / 環境のマルチプロセッシング

以下のColabが面白かったので、ざっくり訳してみました。・Stable Baselines Tutorial - Mul…

npaka

5年前

7

Stable Baselines チュートリアル(2) / Gymラッパー、モデルの保存と読み込み

以下のColabが面白かったので、ざっくり訳してみました。・Stable Baselines Tutorial - Gym w…

npaka

5年前

4

Stable Baselines チュートリアル(1) / Getting Started

以下のColabが面白かったので、ざっくり訳してみました。・Stable Baselines Tutorial - Get…

npaka

5年前

5

SimPLe : Atariゲームのモデルベースの強化学習

以下の記事が面白かったので、ざっくり訳してみました。・Simulated Policy Learning in Video Models 1. はじめに「深層強化学習」は、視覚的な入力から複雑なタスクのポリシーを学習するために使用でき、Atariゲームで大きな成功を収めています。しかし、多くの最先端のアプローチには、『環境との非常に多くの対話が必要』という制限があります。人間が学習するために必要な対話よりもはるかに多くの対話が必要になります。人々がこれらのタスクを効

PPO : OpenAIのデフォルトの強化学習アルゴリズム

以下の記事が面白かったので、ざっくり訳してみました。・Proximal Policy Optimization 1.…

npaka

5年前

6

DQN & Double Q-Learning & Prioritized Replay & Dueling DQN : DQNな強化学習アルゴ…

以下の記事が面白かったので、ざっくり訳してみました。・OpenAI Baselines: DQN 1. はじめ…

npaka

5年前

6

ACKTR & A2C : Actor-Criticな強化学習アルゴリズム

以下の記事が面白かったので、ざっくり訳してみました。・OpenAI Baselines: ACKTR & A2C 1…

npaka

5年前

4

World Model : 夢の中で学ぶ強化学習アルゴリズム

1. 強化学習の問題「強化学習」は、「エージェント」が「環境」の「状態」に応じてどのように…

npaka

5年前

12

HER : 失敗から学ぶ強化学習アルゴリズム

以下の記事が面白かったので、ざっくり訳してみました。・Ingredients for Robotics Researc…

npaka

5年前

21

PyBullet Robotics Environments

1. PyBullet Robotics Environments「PyBullet Robotics Environments」は、MuJoCo環境に似た3…

npaka

5年前

6

MarLÖ : マインクラフトの強化学習環境

1. MarLÖ 「MarLÖ」は、マインクラフトの強化学習環境です。金の鉱石を発見する、Mobを捕まえるなどの、マインクラフトに関するタスクに挑戦します。OpenAI GymのGymインタフェースを利用して学習させることができます。 2. MarLÖのタスク◎MarLo-MazeRunner-v0 【説明】迷路を抜けてレッドストーンの柱への到達するタスクです。【観察】エージェントが使用する深度マップが提供されます。これにより、このタスクが簡単になります。【行

フォローしませんか？

2019年10月の記事一覧

WindowsでOpneAI GymとStable BaselinesとGym Retroを実行する

Stable Baselines チュートリアル(5) / カスタムGym環境の作成

Stable Baselines チュートリアル(4) / コールバックとハイパーパラメータの調整

Stable Baselines チュートリアル(3) / 環境のマルチプロセッシング

Stable Baselines チュートリアル(2) / Gymラッパー、モデルの保存と読み込み

Stable Baselines チュートリアル(1) / Getting Started

SimPLe : Atariゲームのモデルベースの強化学習

PPO : OpenAIのデフォルトの強化学習アルゴリズム

DQN & Double Q-Learning & Prioritized Replay & Dueling DQN : DQNな強化学習アルゴ…

ACKTR & A2C : Actor-Criticな強化学習アルゴリズム

World Model : 夢の中で学ぶ強化学習アルゴリズム

HER : 失敗から学ぶ強化学習アルゴリズム

PyBullet Robotics Environments

MarLÖ : マインクラフトの強化学習環境