技术栈
马尔科夫决策
不去幼儿园
3 天前
人工智能
·
算法
·
机器学习
·
强化学习
·
马尔科夫决策
【强化学习】Double DQN(Double Deep Q-Network)算法
📢本篇文章是博主强化学习(RL)领域学习时,用于个人学习、研究或者欣赏使用,并基于博主对相关等领域的一些理解而记录的学习摘录和笔记,若有不当和侵权之处,指出后将会立即改正,还望谅解。文章分类在👉强化学习专栏:
@@老胡
1 年前
深度强化学习
·
贝尔曼方程
·
马尔科夫决策
深度强化学习(三)马尔科夫决策过程
参考文章:https://blog.csdn.net/taka_is_beauty/article/details/88356375