WindowsでOpneAI GymとStable BaselinesとGym Retroを実行する

2019年10月28日 09:06

「OpenAI Gym」と「Stable Baselines」と「Gym Retro」のWindowsへのインストール方法をまとめます。Windows版は10以降の64bit版が対象になります。

1. WindowsでOpenAI Gymをインストール

「OpenAI Gym」のWindows版は実験的リリースなので、最小インストール（Algorithmic、Classic control、Toy Textのみ）までしか対応していません。Atari環境は通常の方法ではインストールできません。

(1) Anacondaをインストール
(2) スタートメニューから「Anaconda Powershell Prompt」を開く
(3) 仮想環境を作成して有効化
「openaigym」という名前で、AnacondaのPython3.6の仮想環境が生成します。その後、有効化しています。

$ conda create -n openaigym python=3.6 anaconda
$ conda activate openaigym

(4) OpenAI Gymのインストール

$ pip install gym

2. CartPole環境の動作確認

動作確認のコードは次の通りです。

import gym

# 環境の生成
env = gym.make("CartPole-v1")
env.reset()

# ランダム行動
for _ in range(2000):
    env.render()
    env.step(env.action_space.sample())

3. WindowsでAtari環境をインストール

WindowsへのAtari環境のインストール方法は次の通りです。
(情報源)

(1) Visual Studio 2015 C++ビルドツールをインストール
以下のサイトからダウンロードしてインストールしてください。「Visual Studio 2017 C++ビルドツール」がインストールされている場合は、アンインストールしてから行ってください。

・Microsoft Build Tools 2015
https://www.microsoft.com/ja-JP/download/details.aspx?id=48159

(2)Atari環境のインストール
以下のコマンドでAtari環境をインストールします。

$ pip install --no-index -f https://github.com/Kojoley/atari-py/releases atari_py

4. Atari環境の動作確認

動作確認のコードは次の通りです。

import gym

# 環境の生成
env = gym.make("CartPole-v1")
env.reset()

# ランダム行動
for _ in range(2000):
    env.render()
    env.step(env.action_space.sample())

5. WindowsでStable Baseliesをインストール

(1) Stable Baselinesに必要なシステムパッケージをインストール
「Microsoft MPI v10.0」をインストールします。「msmpisetup.exe」をダウンロードして実行してください。

・Microsoft MPI v10.0
https://www.microsoft.com/en-us/download/details.aspx?id=57467

(2) Stable Baselinesをインストール
AnacondaのPython 3.6の仮想環境で以下のコマンドを入力します。

$ pip install stable-baselines[mpi]==2.8.0
$ pip install tensorflow==1.14.0
$ pip install pyqt5
$ pip install imageio

6. Stable Baselinesの動作確認

動作確認のコードは次の通りです。

import gym
from stable_baselines.common.vec_env import DummyVecEnv
from stable_baselines import PPO2

# 環境の生成
env = gym.make('CartPole-v1')
¥env = DummyVecEnv([lambda: env])

# モデルの生成
model = PPO2('MlpPolicy', env, verbose=1)

# モデルの学習
model.learn(total_timesteps=10000)

# モデルのテスト
state = env.reset()
for i in range(2000):
    env.render()
    action, _ = model.predict(state)
    state, rewards, done, info = env.step(action)
    if done:
        break

7. WindowsでGym Retroをインストール

AnacondaのPython 3.6の仮想環境で以下のコマンドを入力します。

$ pip install gym-retro

8 Gym Retroの動作確認

動作確認のコードは次の通りです。

import retro

# 環境の生成
env = retro.make(game='Airstriker-Genesis')

env.reset()

# ランダム行動
for _ in range(2000):
    env.render()
    env.step(env.action_space.sample())

この記事が気に入ったらサポートをしてみませんか？