マガジンのカバー画像

強化学習入門

109
強化学習関連のノートをまとめました。
運営しているクリエイター

記事一覧

llama.cpp による transformersモデル の量子化

「llama.cpp」による「transformersモデル」の量子化の手順をまとめました。 1. Llama.cppの…

npaka
2日前
13

JAT (Jack of All Trades) の概要

以下の記事が面白かったので、簡単にまとめました。 1. JAT (Jack of All Trades)「JAT」 (Ja…

npaka
3日前
14

最近話題になった AIエージェントの強化学習環境 のまとめ

最近話題になった AIエージェントの学習環境 をまとめました。 1. MineDojo「MineDojo」は、M…

npaka
1年前
25

MuJoCo Unityプラグインの使い方

「MuJoCo Unityプラグイン」の使い方をまとめました。 1. MuJoCo「MuJoCo」(Multi-Joint dyna…

npaka
1年前
12

PettingZoo 入門 (2) - API

「PettingZoo」のAPIについてまとめました。 前回1. 学習環境の初期化「PettingZoo」の使い方…

npaka
1年前
5

Stable Baselines 3 入門 (2) - Monitor

「Stable Baselines 3」の「Monitor」の使い方をまとめました。 前回1. Monitor「Monitor」は…

npaka
1年前
5

PettingZoo 入門 (1) - マルチエージェント強化学習環境セット

マルチエージェント強化学習環境セット「PettingZoo」の基本的な使い方をまとめました。 1. PettingZoo「PettingZoo」は、マルチエージェント強化学習環境セットです。「OpenAI Gym」のマルチエージェント版のようなものになります。 2. Stable Baselines 3とPettingZooのインストール「Stable Baselines 3」と「PettingZoo」のインストールのインストール手順は、次のとおりです。 (1) Pyt

Stable Baselines 3 入門 (1) - 強化学習アルゴリズム実装セット

強化学習アルゴリズム実装セット「Stable Baselines 3」の基本的な使い方をまとめました。 1.…

npaka
1年前
8

DeepMindのAlphaシリーズまとめ

DeepMindのAlphaシリーズをまとめました。 1. AlphaGo 「AlphaGo」はDeepMindによって開発さ…

npaka
2年前
14

toio 入門 (3) - 人工知能によるキューブの操作

「Unity ML-Agents」と「toio SDK for Unity v1.4.0」を使って、人工知能でtoioキューブを操作…

npaka
2年前
8

Petoi Bittle 入門 (20) - OpenCat Gymによる強化学習

以下の記事を参考に書いてます。 ・Reinforcement Learning - OpenCat Gym 前回1. ロボット…

npaka
2年前
3

AndroidEnv: Androidの強化学習環境

以下の記事を参考に書いてます。 ・AndroidEnv: The Android Learning Environment | DeepMin…

npaka
2年前
1

Stable Baselines と Raspberry Pi によるホッケーロボットの強化学習

「AI・人工知能EXPO 2020 【秋】」の「ギリア」ブースにて、「Stable Baselines」 と「Raspber…

npaka
3年前
20

Unity ML-Agents と toio によるサッカーロボットの強化学習

「AI・人工知能EXPO 2021 【春】」の「ギリア」ブースにて、「Unity ML-Agents」 と「toio」によるサッカーロボットの強化学習を展示しました。 動画を撮ってくれた人がいました。ありがとうございます。 「toio」はiPhoneでBluetooth経由で制御されており、1台のiPhoneで8台分の「toio」の推論を行っています。 今回は、「Unity ML-Agents」と「toio」によるサッカーロボットの強化学習の作成の流れを紹介します。