DDPG算法

DDPG算法

全称Deep Deterministic Policy Gradient,是对DPG、DQN的继承、发展和改进

  • 对DQN算法:使其能够适用于连续动作空间
  • 对DPG算法:使用神经网络来拟合函数

算法介绍

核心:确定性策略梯度理论 ,在DPG算法中被提出,原论文,推导过程相当复杂,我也不大能看懂,总之用就完事了😂

训练流程:参考了DQN,因此属于Off Policy算法,使用了经验回放缓存,引入了actor target和critic target

算法伪代码

相关推荐
梭七y27 分钟前
【力扣hot100题】(032)排序链表
算法·leetcode·链表
SsummerC28 分钟前
【leetcode100】数组中的第K个最大元素
python·算法·leetcode
编程绿豆侠31 分钟前
力扣HOT100之链表:206. 反转链表
算法·leetcode·链表
永恒迷星.by2 小时前
文件操作(c语言)
c语言·c++·算法·文件操作
还有你Y2 小时前
MIMO预编码与检测算法的对比
算法·预编码算法
凯强同学2 小时前
第十四届蓝桥杯大赛软件赛省赛Python 大学 C 组:7.翻转
python·算法·蓝桥杯
记得早睡~3 小时前
leetcode51-N皇后
javascript·算法·leetcode·typescript
lancyu4 小时前
C语言--插入排序
c语言·算法·排序算法
点云SLAM4 小时前
C++20新增内容
c++·算法·c++20·c++ 标准库
独好紫罗兰5 小时前
洛谷题单3-P1217 [USACO1.5] 回文质数 Prime Palindromes-python-流程图重构
开发语言·python·算法