【强化学习】08周博磊强化学习纲要学习笔记——第四课下

kkkkkkkkk_12012026-02-13 8:34

今日课程提纲 ：

今天是第四课，我将给大家介绍价值函数的近似，首先介绍价值函数近似的基本原理，价值函数近似如何在prediction，就是给定一个策略函数，如何去估计它的价值。另外会分析价值函数性是如何在控制里面的应用。最后分析非常有名的这个deep q network在atari游戏里面是如何应用的。

目录

[一、Intorduction on function approximation](#一、Intorduction on function approximation)

一、Intorduction on function approximation

上一篇：如何检测、排除手机控制屏幕

下一篇：js实现移动动画封装

热门推荐

01GitHub 镜像站点 022026年7月AI圈大地震：GPT-5.6被政府限制、Claude入驻Slack、Anthropic自研芯片 03AI科技热点日报 | 2026年07月01日 04幻兽帕鲁 - 服务器管理员权限与 GM 命令完全指南 05国内可直接用、免费额度/永久免费的大模型API清单（含 SiliconFlow、火山、阿里、智谱、百度、Kimi、DeepSeek、DMXAPI 等）06AI 编程 IDE 全景解析 2026：Agent 全面接管开发链路 07Codex 下载安装指南：Windows 和 macOS 官方版下载 082026 国产 AI 大模型横评：DeepSeek、通义千问、Kimi、文心一言、星火、豆包谁更能打？09昇腾910B系列芯片完全指南：四款型号对比、服务器选型与大模型部署实战 10几个好用的ip纯净度检测网站