技术栈
【强化学习】09周博磊强化学习纲要学习笔记——第五课上
kkkkkkkkk_1201
2026-02-14 18:01
今日课程提纲
:
各位同学大家好,我们开始第四课下半段的内容,我们讨论了如何用函数近似来拟合我们的价值函数。接下来我将给大家介绍如何用
非线性函数
来拟合我们的价值函数。
目录
[四、Deep Q networks](#四、Deep Q networks)
四、Deep Q networks
笔记
深度学习
学习
强化学习
上一篇:
第G6周:CycleGAN实战
下一篇:
Python 导包、分包完全教程
相关推荐
星恒随风
几秒前
C++ string 入门(一)
开发语言
·
c++
·
笔记
·
学习
hnult
2 分钟前
2026在线笔试平台选型指南:考试云九重防作弊与六大AI能力解析
人工智能
·
笔记
·
microsoft
·
课程设计
zdr尽职尽责
4 分钟前
Unity录像功能
学习
·
ui
·
unity
·
游戏引擎
cuso4win
19 分钟前
Agent 项目里的 Eval 到底是什么?怎么分类?不同项目应该怎么评测?
笔记
·
python
·
agent
·
eval
lazy H
19 分钟前
IDEA 如何配置 JDK?项目 SDK 报错解决方法
java
·
ide
·
后端
·
学习
·
intellij-idea
格兰芬多呼神护卫
19 分钟前
轮臂机器人-运动控制软件架构方案学习笔记
笔记
·
学习
·
机器人
江屿风
21 分钟前
C++图论基础Bellman-Ford与spfa算法如何判断负环
开发语言
·
c++
·
笔记
·
算法
·
图论
jinxindeep
30 分钟前
混元Hy-Embodied-0.5-VLA:从视觉-语言-动作模型到真实世界机器人学习全栈系统
人工智能
·
学习
·
机器人
极光代码工作室
36 分钟前
基于机器学习的新闻分类系统
人工智能
·
python
·
深度学习
·
机器学习
xianghongtao0116
42 分钟前
给 RNN 装上“会增长的记忆”:解读 Google 的 Memory Caching
人工智能
·
rnn
·
深度学习
·
googlecloud
热门推荐
01
2026年6月AI行业全景:从百模大战到Agent元年,这30天发生了什么?
02
HTTP 与 HTTPS 的区别:从原理到实战详解
03
2026 AI 编程工具终极实战指南:Cursor vs Claude Code vs Copilot,开发者该怎么选?
04
【AI】2026 年具身智能模型和世界模型总结
05
2026 年 AI 编程工具终极横评:Cursor vs Claude Code vs Copilot vs Windsurf
06
GitHub 镜像站点
07
AI科技热点日报 | 2026年6月1日
08
上线仅72小时被强制下架:Claude Fable 5 的短命
09
Claude Code、Codex、Cursor三分天下:2026年AI编程Agent生态全景剖析
10
《置身钉内》原文-可播放阅读