技术栈
noisy net
NoahBBQ
1 年前
pytorch
·
gym
·
dqn
·
cartpole-v1
·
noisy net
Noisy DQN 跑 CartPole-v1
gym 0.26.1 CartPole-v1 NoisyNet DQNNoisyNet 就是把原来Linear里的w/b 换成 mu + sigma * epsilon, 这是一种非常简单的方法,但是可以显著提升DQN的表现。 和之前最原始的DQN相比就是改了两个地方,一个是Linear改成了NoisyLinear,另外一个是在agent在take_action的时候策略 由ε-greedy改成了直接取argmax。详细见下面的代码。