【强化学习】08周博磊强化学习纲要学习笔记——第四课下

今日课程提纲

今天是第四课,我将给大家介绍价值函数的近似,首先介绍价值函数近似的基本原理,价值函数近似如何在prediction,就是给定一个策略函数,如何去估计它的价值。另外会分析价值函数性是如何在控制里面的应用。最后分析非常有名的这个deep q network在atari游戏里面是如何应用的。

目录

  • [一、Intorduction on function approximation](#一、Intorduction on function approximation)

一、Intorduction on function approximation

相关推荐
今天你TLE了吗2 小时前
JVM学习笔记:第二章——类加载子系统
java·开发语言·jvm·笔记
AutumnorLiuu2 小时前
C++并发编程学习(四)——死锁及其预防
开发语言·c++·学习
Nan_Shu_6142 小时前
学习: Blender 粒子篇
学习·blender
Pythonliu72 小时前
【February 组队学习【数学建模导论】~】
学习·数学建模
Nan_Shu_6142 小时前
学习: Blender 场景灯光篇
学习·blender
139的世界真奇妙2 小时前
工作事宜思考点
经验分享·笔记·golang·go
探序基因2 小时前
knockTF2.0数据库-找上游转录因子
数据库·经验分享·笔记
ljt27249606612 小时前
Flutter笔记--StreamBuilder
笔记·flutter
时代的凡人10 小时前
0208晨间笔记
笔记