マガジンのカバー画像

強化学習入門

109
強化学習関連のノートをまとめました。
運営しているクリエイター

2019年12月の記事一覧

MineRL : マインクラフトのデモの大規模データセット

以下の記事が面白かったので、ざっくり訳してみました。 ・MineRL: A Large-Scale Dataset of…

npaka
4年前
5

強化学習のヒントとコツ

以下の記事を参考に書いてます。 ・Reinforcement Learning Tips and Tricks 1. 要約このセ…

npaka
4年前
21

ソニックへの世界モデルの適用

以下の記事が面白かったので、簡単にまとめました。 1. 要約「OpenAI」は、2018年4月5日に「R…

npaka
4年前
6

深層学習の二重降下

以下の記事を参考に書いてます。 ・Deep Double Descent 1. 要約 「二重降下現象」は、「CN…

npaka
4年前
10

強化学習のロードマップ

ノートに書いてる強化学習記事の関係性をまとめてみました。

npaka
4年前
7

強化学習における汎化の定量化

以下の記事を参考に書いてます。 ・Quantifying Generalization in Reinforcement Learning …

npaka
4年前
3

Procgen Benchmark

以下の記事を参考に書いてます。 ・Procgen Benchmark 1. はじめに「Procgen Benchmark」は、強化学習エージェントが汎化スキルをどれだけ速く学習するかを測定する、16個の強化学習環境です。 2. Procgen環境 ◎ bigfish プレイヤーは小さな魚から始まり、自分より小さい魚を食べることで大きくなります。自分より大きな魚と接触すると、プレイヤーは食べられ、エピソード完了となります。魚を食べると小さな報酬を受け取ります。他のすべての

GVGAI GYM

1. GVGAI GYM「GVGAI GYM」は、ビデオゲーム記述言語(Video Game Description Language)で記…

npaka
4年前
2