pytorch中的loss.backward()和optimizer.step()中的使用的梯度方向问题

python 复制代码
# 举例:梯度下降更新模型参数
optimizer = torch.optim.SGD(model.parameters(), lr=learning_rate)

# 在每个训练步骤中
optimizer.zero_grad()  # 清零梯度
output = model(input)
loss = loss_function(output, target)
loss.backward()       # 计算梯度
optimizer.step()       # 更新模型参数(沿着梯度的负方向)

在这个例子中,loss.backward() 计算的梯度方向是损失函数上升的方向,而 optimizer.step() 则使用了梯度的负方向来更新模型参数。

相关推荐
xx_xxxxx_4 分钟前
AI的工程基础1-最优化算法
人工智能·机器学习
Token炼金师22 分钟前
目标的抉择:CLM 称王、MLM 退场、FIM 补刀、多 Token 与多语 —— 预训练目标五辩
人工智能·深度学习·预训练·clm·mlm·fim·mtp
星马梦缘27 分钟前
机器学习与模式识别 第十三章 从线性模型到神经网络 考点压缩
人工智能·pytorch·神经网络·机器学习·激活函数·relu
大鱼>31 分钟前
深度学习入门:神经网络原理与 PyTorch 实战
pytorch·深度学习·神经网络
手写码匠41 分钟前
手写 LLM 安全护栏:从内容审核到越狱防御的完整实现
人工智能·深度学习·算法·aigc
AI科技星42 分钟前
乖乖数学全域数学加速正电荷会产生反向引力
人工智能·机器学习·概率论·量子计算·乖乖数学·全域数学·引力
大囚长44 分钟前
信息约简对智能系统预测的重要性
人工智能·深度学习·机器学习
2601_951659992 小时前
YOLOv11 改进 - 主干网络 EfficientRep:一种旨在提高硬件效率的RepVGG风格卷积神经网络架构
深度学习·yolo·计算机视觉
m0_626535202 小时前
MRR(Mean Reciprocal Rank)和 NDCG(Normalized Discounted Cumulative Gain)
人工智能·机器学习
直接冲冲冲2 小时前
65-批量归一化
人工智能·深度学习·计算机视觉