見出し画像

Unity ML-Agentsで作られた研究ベンチマーク

Unity ML-Agentsで作られた主要な研究ベンチマークをまとめました。

Obstacle Tower
「Obstacle Tower」は、エージェントが塔を可能な限り上の階まで登ることを目的としたゲーム環境です。機械学習研究者向けのコンテストのために開発された環境になります。

Arena
「Arena」は、シングル/マルチエージェントインテリジェンスのための一般的な評価プラットフォームと構築ツールキットです。
以下の3つのツールを提供します。

・Arena-BuildingToolkit
「Arena-Building Toolkit」は、研究指向ユーティリティを備えたシングルエージェントゲームを簡単に作成できるツールキット。新しいマルチエージェントの問題を数分で作成するための特別なサポートも利用できます。

・Arena-Baselines
「Arena-Baselines」は、RLlibに基づく最先端のシングル/マルチエージェント強化学習ベースラインの実装です。
シングルエージェントのベースラインは、RLlibのものです。
マルチエージェントベースラインには、次のものがあります。

・independent learners
・self-play
・population-based training (StarCraft)
・share weights between arbitrary agents or teams
・sharing observations (自分の観察、チームの観察、グローバルな観測、隠された状態),
・multi-sensors (1人称/3人称視覚、LIDARベクトル)
・centralized critic and decentralized actor (centralised value baseline)

・Arena-Benchmark
「Arena-Benchmark」は、多様なロジックと表現の学習環境を備えた、シングル/マルチエージェントインテリジェンスの一般的な評価プラットフォームです。

Animal AI Testbed
「Animal AI」は、汎用な人工知能を実現するためにはどうしたらいいのかを、動物の知能を再現することから導き出すことを目的とした試験環境です。

Marathon Environments
「Marathon Environments」は、Unity ML-Agents Toolkitで使用する高次元の連続制御環境のセットです。Unity ML-Agentsまたは任意のOpenAI Gym互換アルゴリズムを利用して訓練できます。


この記事が気に入ったらサポートをしてみませんか?