【强化学习】08周博磊强化学习纲要学习笔记——第四课下

今日课程提纲

今天是第四课,我将给大家介绍价值函数的近似,首先介绍价值函数近似的基本原理,价值函数近似如何在prediction,就是给定一个策略函数,如何去估计它的价值。另外会分析价值函数性是如何在控制里面的应用。最后分析非常有名的这个deep q network在atari游戏里面是如何应用的。

目录

  • [一、Intorduction on function approximation](#一、Intorduction on function approximation)

一、Intorduction on function approximation

相关推荐
zjeweler1 天前
“网安+护网”终极300多问题面试笔记-3共3-综合题型(最多)
笔记·网络安全·面试·职场和发展·护网行动
m0_488913011 天前
万字长文带你梳理Llama开源家族:从Llama-1到Llama-3,看这一篇就够了!
人工智能·学习·机器学习·大模型·产品经理·llama·uml
数厘1 天前
2.1SQL 学习:先懂数据库概念再学 SQL
数据库·sql·学习
YoseZang1 天前
【机器学习】【手工】Streaming Machine Learning 流数据学习 – 应对变化的机器学习方法(一)
人工智能·学习·机器学习
大唐荣华1 天前
从π到F:分阶段强化学习如何让机器人学会精密装配
强化学习·rl·vla
chh5631 天前
C++--模版初阶
c语言·开发语言·c++·学习·算法
航Hang*1 天前
Windows Server 配置与管理——第8章:配置Web服务器
运维·服务器·windows·学习·vmware
Elaine3361 天前
【软件测试系统学习笔记:从理论基础到接口实战】
软件测试·笔记·学习·接口测试
xuhaoyu_cpp_java1 天前
Maven学习(二)
java·经验分享·笔记·学习·maven
西门吹-禅1 天前
java 微服务学习笔记
java·学习·微服务