技术栈
【强化学习】09周博磊强化学习纲要学习笔记——第五课上
kkkkkkkkk_1201
2026-02-14 18:01
今日课程提纲
:
各位同学大家好,我们开始第四课下半段的内容,我们讨论了如何用函数近似来拟合我们的价值函数。接下来我将给大家介绍如何用
非线性函数
来拟合我们的价值函数。
目录
[四、Deep Q networks](#四、Deep Q networks)
四、Deep Q networks
笔记
深度学习
学习
强化学习
上一篇:
第G6周:CycleGAN实战
下一篇:
Python 导包、分包完全教程
相关推荐
charlie114514191
几秒前
嵌入式Linux驱动开发(3)——内核模块机制 - Linux 的插件系统
linux
·
运维
·
开发语言
·
驱动开发
·
嵌入式硬件
·
学习
做cv的小昊
3 分钟前
【TJU】研究生应用统计学课程笔记(2)——第一章 数理统计的基本知识(1.3 统计中常用的分布族)
笔记
·
线性代数
·
数学建模
·
矩阵
·
概率论
·
学习方法
·
抽象代数
ouliten
6 分钟前
cuda编程笔记(38)--CUDA 异步回调
笔记
·
cuda
传说故事
9 分钟前
【论文阅读】ViVa: A Video-Generative Value Model for Robot Reinforcement Learning
论文阅读
·
人工智能
·
强化学习
·
具身智能
keineahnung2345
19 分钟前
PyTorch 張量尺寸為 1 時,步長為何不具語意?
人工智能
·
pytorch
·
python
·
深度学习
Better Bench
22 分钟前
《八十天环游地球》阅读笔记
笔记
·
读书笔记
·
八十天环游地球
sheeta1998
25 分钟前
LeetCode 每日一题笔记 日期:2026.04.21 题目:1722. 执行交换操作后的最小汉明距离
笔记
·
算法
·
leetcode
思绪无限
40 分钟前
YOLOv5至YOLOv12升级:日常场景下的人脸检测系统的设计与实现(完整代码+界面+数据集项目)
深度学习
·
yolo
·
目标检测
·
日常场景下的人脸检测
·
yolov12
·
yolo全家桶
一休哥※
1 小时前
YOLOv11改进系列 | 引入EMO ICCV2023的C3k2_iRMB模块,轻量注意力残差混合块增强C3k2,多尺度分割更稳更准
深度学习
·
yolo
·
计算机视觉
喜欢吃燃面
1 小时前
Linux 进程信号深度解析:从概念到产生机制
linux
·
开发语言
·
学习
热门推荐
01
2026年4月技术前沿:AI大模型爆发、智能体革命与量子安全新纪元
02
GitHub 镜像站点
03
2026年4月AI大事件深度解读:大模型竞争进入“深水区“
04
2026 年 AI 编程助手全面对比评测:Cursor vs Copilot vs Claude Code vs GitHub Copilot Free
05
近期有什么ai的新消息,新动态? 2026.4月
06
AI Weekly | 2026年4月第二周 · GitHub热门项目与AI发展趋势深度解析
07
Claude Code Windows 兼容性问题:指定版本 2.1.112 可解决
08
从限购到畅通:GLM-5.1 Coding Plan接入攻略
09
UBUNTU Claude Code 报错 claude native binary not installed
10
免费!不限量!用opencode接入英伟达(NVIDIA)大模型,轻松打造你的 AI 编程助手