Pytorch里面参数更新前为什么要梯度手动置为0?

因为在一般情况下,每次minibatch之后,都会计算得到一个loss,进而计算该loss关于全局参数的梯度。如果在下一次minibatch 进入模型,计算得到相应的loss和梯度之前,不对优化器的梯度进行置0操作,那么几次batch的梯度会有一个累积效应,影响模型参数的优化。

在每一次batch'训练完之后,计算得到loss损失函数和相应梯度,都会对模型参数进行调整,那么该batch数据在这一轮训练里面的作用已经完成了。我们不希望这些优化过模型参数的batch的loss梯度累积起来,继续对模型参数优化产生影响。

相关推荐
2401_880071401 分钟前
html标签如何提升可访问性_aria-label与title区别【指南】
jvm·数据库·python
AI科技星2 分钟前
算法联盟·全域数学公理体系下黑洞标量毛发与LVK引力波O4全维理论、求导、证明、计算、验证、分析
人工智能·线性代数·算法·架构·学习方法·量子计算
2401_850491653 分钟前
如何管理多个监听器_listener.ora中非默认端口配置实战
jvm·数据库·python
2501_940041743 分钟前
游戏实战prompt
python·pygame
YuanDaima20484 分钟前
图论基础原理与题目说明
数据结构·人工智能·python·算法·图论·手撕代码
code bean4 分钟前
【Langchain】 ChatPromptTemplate:从“手动拼字符串“到“专业模板“的进化之路
人工智能·机器学习·langchain
2301_781571426 分钟前
Go语言如何用sqlx_Go语言sqlx数据库操作教程【入门】
jvm·数据库·python
Aipollo7 分钟前
AI助手模块工作流程技术总结
人工智能·ai
2401_880071407 分钟前
mysql安装后如何进行初始化安全配置_mysql_secure_installation实操
jvm·数据库·python
eastyuxiao8 分钟前
主流物联网协议 超详细讲解
大数据·人工智能·物联网·智慧城市·能源·数字孪生