マガジンのカバー画像

強化学習入門

109
強化学習関連のノートをまとめました。
運営しているクリエイター

2019年11月の記事一覧

Safety Gym

以下の記事を参考に書いてます。 ・Safety Gym 1. はじめに訓練中に安全上の制約を尊重する…

npaka
4年前
2

パラメータノイズによる探索の向上

以下の記事が面白かったので、ざっくり訳しました。 ・Better Exploration with Parameter No…

npaka
4年前
4

AlphaStar : マルチエージェント強化学習を使用したStarCraft IIのグランドマスターレ…

以下の記事が面白かったので、ざっくり訳しました。 ・AlphaStar: Grandmaster level in Star…

npaka
4年前
6

階層強化学習

以下の記事を参考に書いてます。 ・Learning a Hierarchy 1. 階層強化学習 (HRL: Hierarchi…

npaka
4年前
7

StarCraft II学習環境の利用

以下の記事が面白かったので、ざっくり訳してみました。 ・Getting Started with the StarCra…

npaka
4年前
2

AI研究環境としてStarCraft II

以下の記事が面白かったので、ざっくり訳してみました。 ・DeepMind and Blizzard open StarC…

npaka
4年前
3

TensorFlow_1.Xの警告の非表示

TensorFlowは2.0が最新版のため、1.0を使っていると警告でるので、非表示にしたい時は以下を追加。 (情報源) import osimport tensorflow as tfimport loggingimport warningsos.environ['TF_CPP_MIN_LOG_LEVEL'] = '3'warnings.simplefilter(action='ignore', category=FutureWarning)warnings.simple

Stable BaselinesでHERを使う

1. HER(Hndsight Experience Replay)強化学習アルゴリズム「HER」については、以下を参照。 …

npaka
4年前
2

知能の発達の歴史と人工知能

「考える脳 考えるコンピュータ」(ジェフ・ホーキンス)で紹介している「知能の発達の歴史」…

npaka
4年前
12

S-RL Toolbox入門

1. S-RL Toolbox「S-RL Toolbox」は、ロボット用の強化学習(RL)および状態表現学習(SRL)ツール…

npaka
4年前
3

Stable BaselinesでLSTMポリシーを使う

1. LSTM「LSTM」は、時系列を扱えるニューラルネットワークで、主に動画分類、自然言語処理、…

npaka
4年前
2