強化学習アルゴリズムのプロトタイピングのためのフレームワーク
- ソフト名 : Dopamine
- OS :
- 言語 :
- 開発者 : HOME
Dopamine 詳細説明
ドーパミンは、強化学習アルゴリズムの高速プロトタイピングのための研究枠組みです。それは、ユーザーが野生のアイデアを自由に実験することができる小さく、簡単にグロックしたコードベースの必要性を満たすことを目的としています(投機的研究)。この最初のバージョンは、Atari 2600ゲームプレイングに適用された単一GPUレインボーエージェント(Hessel et al。、2018)のサポートに焦点を当てています(Bellemare et al。、2013)。具体的には、私達のレインボーエージェントは、Hesselら、NステップBellmanの更新、優先経験の再生、および分配強化学習によって最も重要な3つの成分を実装しています。完全性については、DQNの実装も提供しています(MNIH et al。、2015)。詳細については、当社のドキュメントをご覧ください。我々はドーパミンの使用方法を実証する一連のカタロバのノートを提供します。私たちはすべてのゲームで、提供されたすべてのエージェントの学習曲線を表示するウェブサイトを提供します。