pytorch loss及其梯度

目录

  • 1.loss的种类
    • [1.1 MSE](#1.1 MSE)
    • [1.2 MSE推导](#1.2 MSE推导)
    • [1.3 autograd.grad](#1.3 autograd.grad)
    • [1.4 loss.backward](#1.4 loss.backward)
  • [2. Softmax](#2. Softmax)
    • [2.1 softmax推导](#2.1 softmax推导)

1.loss的种类

常见两种一种是均方差,一种是交叉熵

1.1 MSE

1.2 MSE推导

1.3 autograd.grad

1.4 loss.backward


注意:autograd.grad直接返回梯度,而backward梯度保存再w.grad中

2. Softmax

softmax函数范围是[0,1]所有分类概率和等于1,softmax的特性是使概率大的更大,概率小的更小。

2.1 softmax推导

  • i=j
  • i/=j
  • 。总结
  • 应用
相关推荐
啊哈哈哈哈哈啊哈哈1 分钟前
cv实践——银行卡数字识别
python·opencv·计算机视觉
shy^-^cky2 分钟前
卷积神经网络(CNN)客观题(含答案+解析)
人工智能·神经网络·cnn
东离与糖宝2 分钟前
微软BitNet开源:用Java在边缘设备部署7B级本地大模型(含ONNX Runtime优化)
java·人工智能
老成说AI6 分钟前
营收跨越400亿:拆解追觅科技的全球化“炸场”战略与TikTok操盘术
人工智能·科技·tiktok·soundview
桂花饼6 分钟前
国内直连 GPT-5.4、 qwen3.5-plus 与 Gemini 3.1(附API接入方案)
人工智能·sora2·openclaw·gpt-5.4·gemini3.1·qwen 3.5 plus
2401_889884669 分钟前
深入理解Python的if __name__ == ‘__main__‘
jvm·数据库·python
恬静的小魔龙10 分钟前
【AI】OpenClaw 祛魅教程 | 面向普通人的 AI 入门指南
人工智能
坚持学习前端日记11 分钟前
AgentAi视频模型开发对接部署使用
前端·人工智能·python·flask·音视频
酱紫学Java12 分钟前
数据安全基础:正则表达式 (Regex) 从入门到实战
python·正则表达式
飞Link13 分钟前
洞察数据的“分寸感”:深度解析对比学习(Contrastive Learning)
开发语言·python·学习·数据挖掘