技术栈
【强化学习】09周博磊强化学习纲要学习笔记——第五课上
kkkkkkkkk_1201
2026-02-14 18:01
今日课程提纲
:
各位同学大家好,我们开始第四课下半段的内容,我们讨论了如何用函数近似来拟合我们的价值函数。接下来我将给大家介绍如何用
非线性函数
来拟合我们的价值函数。
目录
[四、Deep Q networks](#四、Deep Q networks)
四、Deep Q networks
笔记
深度学习
学习
强化学习
上一篇:
第G6周:CycleGAN实战
下一篇:
Python 导包、分包完全教程
相关推荐
nancy_princess
6 分钟前
clip实验
人工智能
·
深度学习
南境十里·墨染春水
8 分钟前
C++传记(面向对象)虚析构函数 纯虚函数 抽象类 final、override关键字
开发语言
·
c++
·
笔记
·
算法
AI医影跨模态组学
29 分钟前
Radiother Oncol 空军军医大学西京医院等团队:基于纵向CT的亚区域放射组学列线图预测食管鳞状细胞癌根治性放化疗后局部无复发生存期
人工智能
·
深度学习
·
医学影像
·
影像组学
A尘埃
1 小时前
神经网络的激活函数+损失函数
人工智能
·
深度学习
·
神经网络
·
激活函数
没有不重的名么
1 小时前
Pytorch深度学习快速入门教程
人工智能
·
pytorch
·
深度学习
有为少年
1 小时前
告别“唯语料论”:用合成抽象数据为大模型开智
人工智能
·
深度学习
·
神经网络
·
算法
·
机器学习
·
大模型
·
预训练
AI医影跨模态组学
1 小时前
J Transl Med(IF=7.5)苏州大学附属第一医院秦颂兵教授等团队:基于机器学习影像组学的食管鳞癌预后评估列线图
人工智能
·
深度学习
·
机器学习
·
ct
·
医学
·
医学影像
白慕慕
1 小时前
文档网站大全
学习
中屹指纹浏览器
3 小时前
2026基于内核隔离的浏览器环境虚拟化技术在企业数字化运营中的应用研究
经验分享
·
笔记
一个处女座的程序猿
3 小时前
LLMs之Scaling Law之Cross-Entropy:《What Scales in Cross-Entropy Scaling Law?》翻译与解读
深度学习
·
scaling law
·
cross-entropy
热门推荐
01
2026年3月AI领域大事件:DeepSeek引领开源风暴
02
GitHub 镜像站点
03
围棋-html版本
04
纯 HTML/CSS/JS 实现的高颜值登录页,还会眨眼睛!少女心爆棚!
05
班级宠物园部署指南
06
“wsl --install -d Ubuntu-22.04”下载慢,中国地区离线安装 Ubuntu 22.04 WSL方法(亲测2025年5月6日)
07
小黑课堂计算机二级WPSoffice题库软件下载安装教程(2026年3月最新版)
08
OpenClaw 使用和管理 MCP 完全指南
09
UV安装并设置国内源
10
中国象棋-html版本