技术栈
dpg
leaf_leaves_leaf
7 个月前
人工智能
·
笔记
·
深度学习
·
强化学习
·
dpg
·
ddpg
【强化学习的数学原理-赵世钰】课程笔记(十)Actor-Critic 方法
目录一.最简单的 actor-critic(QAC):The simplest actor-critic (QAC)