技术栈

ddpg

leaf_leaves_leaf
1 年前
人工智能·笔记·深度学习·强化学习·dpg·ddpg
【强化学习的数学原理-赵世钰】课程笔记(十)Actor-Critic 方法目录一.最简单的 actor-critic(QAC):The simplest actor-critic (QAC)