強化学習入門

MineRL : マインクラフトのデモの大規模データセット

以下の記事が面白かったので、ざっくり訳してみました。・MineRL: A Large-Scale Dataset of…

npaka

4年前

5

強化学習のヒントとコツ

以下の記事を参考に書いてます。・Reinforcement Learning Tips and Tricks 1. 要約このセ…

npaka

4年前

22

ソニックへの世界モデルの適用

以下の記事が面白かったので、簡単にまとめました。 1. 要約「OpenAI」は、2018年4月5日に「R…

npaka

4年前

6

深層学習の二重降下

以下の記事を参考に書いてます。・Deep Double Descent 1. 要約「二重降下現象」は、「CN…

npaka

4年前

10

強化学習のロードマップ

ノートに書いてる強化学習記事の関係性をまとめてみました。

npaka

4年前

7

強化学習における汎化の定量化

以下の記事を参考に書いてます。・Quantifying Generalization in Reinforcement Learning …

npaka

4年前

3

Procgen Benchmark

以下の記事を参考に書いてます。・Procgen Benchmark 1. はじめに「Procgen Benchmark」は、強化学習エージェントが汎化スキルをどれだけ速く学習するかを測定する、16個の強化学習環境です。 2. Procgen環境 ◎ bigfish プレイヤーは小さな魚から始まり、自分より小さい魚を食べることで大きくなります。自分より大きな魚と接触すると、プレイヤーは食べられ、エピソード完了となります。魚を食べると小さな報酬を受け取ります。他のすべての

GVGAI GYM

1. GVGAI GYM「GVGAI GYM」は、ビデオゲーム記述言語（Video Game Description Language）で記…

npaka

4年前

2

フォローしませんか？

2019年12月の記事一覧

MineRL : マインクラフトのデモの大規模データセット

強化学習のヒントとコツ

ソニックへの世界モデルの適用

深層学習の二重降下

強化学習のロードマップ

強化学習における汎化の定量化

Procgen Benchmark

GVGAI GYM