【强化学习】08周博磊强化学习纲要学习笔记——第四课下

今日课程提纲

今天是第四课,我将给大家介绍价值函数的近似,首先介绍价值函数近似的基本原理,价值函数近似如何在prediction,就是给定一个策略函数,如何去估计它的价值。另外会分析价值函数性是如何在控制里面的应用。最后分析非常有名的这个deep q network在atari游戏里面是如何应用的。

目录

  • [一、Intorduction on function approximation](#一、Intorduction on function approximation)

一、Intorduction on function approximation

相关推荐
2201_7548647826 分钟前
学习日记(2026年3月23日)
学习
dulu~dulu1 小时前
算法---寻找和为K的子数组
笔记·python·算法·leetcode
W起名有点难2 小时前
【Salesforce学习】创建Object笔记
笔记
heartzZ1yy2 小时前
PolarCTF靶场 Crypto 简单 (上)
经验分享·笔记
xw-busy-code2 小时前
Prettier 学习笔记
javascript·笔记·学习·prettier
半壶清水2 小时前
[软考网规考点笔记]-局域网之HDLC 协议
网络·笔记·网络协议·考试
毕设源码-郭学长2 小时前
【开题答辩全过程】以 课程学习过程性评价系统为例,包含答辩的问题和答案
学习
酸奶乳酪2 小时前
IIC学习笔记
笔记·单片机·学习
小陈phd3 小时前
系统架构师学习笔记(二)——计算机体系结构之指令系统
笔记·学习·系统架构
吃杠碰小鸡3 小时前
前端 IndexedDB 完全指南
学习