創屋ぷれす

Rainbow

Rainbowとは強化学習のアルゴリズムの1つです.
DQN=Depp Q Networkに関するものです.

2015年にDeepMindが発表したDQNですが,
研究を進めていくうちにいくつかの問題が発見されました.
その問題に対応するように次々と手法が発表されていった経緯があります.
本ブログの昨日の投稿にもあるDoubleQ学習もその改善手法の1つです.

そういった手法を全て同時に使用したものがRainbowになります.
(とりあえず全部使っとけ,って感じがしますね)
2017年に発表されたRainbowですが,その当時ではatariのSOTAを達成したようです.

古いアルゴリズムですが,DQNを使用する場合,フレームワークで対応しているなら,迷わず使った方が良さそうですね.

創屋のホームページはこちらから

Comments are closed.