技术栈
马尔科夫决策
文弱_书生
6 天前
人工智能
·
神经网络
·
强化学习
·
马尔科夫决策
关于强化学习小记
强化学习(Reinforcement Learning, RL)是一种机器学习方法,通过**智能体(Agent)在环境(Environment)中不断尝试不同的动作(Action),并根据环境给予的奖励(Reward)**来学习最优策略(Policy),从而最大化长期回报(Return)。
不去幼儿园
3 个月前
人工智能
·
算法
·
机器学习
·
强化学习
·
马尔科夫决策
【强化学习】Double DQN(Double Deep Q-Network)算法
📢本篇文章是博主强化学习(RL)领域学习时,用于个人学习、研究或者欣赏使用,并基于博主对相关等领域的一些理解而记录的学习摘录和笔记,若有不当和侵权之处,指出后将会立即改正,还望谅解。文章分类在👉强化学习专栏:
@@老胡
2 年前
深度强化学习
·
贝尔曼方程
·
马尔科夫决策
深度强化学习(三)马尔科夫决策过程
参考文章:https://blog.csdn.net/taka_is_beauty/article/details/88356375