李沐动手学习深度学习——3.3练习

pengshi121382024-03-03 22:44

欢迎讨论

1. 如果将小批量的总损失替换为小批量损失的平均值，需要如何更改学习率？

找到相关的函数介绍nn.MSELoss

默认api nn.MSELoss中是小批量损失的平均值，所以学习率为0.03

拿到对应的batch loss细节如下：

当学习率为0.03，损失函数的值为小批量的总损失时候，发现不能够收敛了。

拿到对应的batch loss细节如下：

可以看到sum的loss大于mean的loss，所以对应的sum的学习率应该调整为0.003。

2. 查看深度学习框架文档，它们提供了哪些损失函数和初始化方法？用Huber损失代替原损失，即

百度即可：
pytorch框架损失函数
 pytorch初始化方法

MeanLoss替换为SmoothL1Loss即可

3. 如何访问线性回归的梯度？

python 复制代码

print(net[0].weight.grad)

可以放在for循环里面计算每一步的梯度

上一篇：高并发高可用--反向代理与负载均衡

下一篇：Nginx 反向代理入门教程

热门推荐

01GitHub 镜像站点 02OpenClaw 使用和管理 MCP 完全指南 03OpenClaw + 飞书（Feishu）环境搭建指南 04【OpenClaw 本地实战 Ep.3】突破瓶颈：强制修改 openclaw.json 解锁 32k 上下文记忆 05Claude Code + GLM4.7 避坑指南：解决 Unable to connect to Anthropic services 06OpenClaw优化飞书API 额度已耗尽问题 07OpenClaw大龙虾机器人完整安装教程 08Clawdbot部署教程：解决‘gateway token missing’授权问题的完整步骤 09Window 10部署openclaw报错node.exe : npm error code 128 10小黑课堂计算机二级WPSoffice题库软件下载安装教程（2026年3月最新版）