pytorch loss及其梯度

目录

  • 1.loss的种类
    • [1.1 MSE](#1.1 MSE)
    • [1.2 MSE推导](#1.2 MSE推导)
    • [1.3 autograd.grad](#1.3 autograd.grad)
    • [1.4 loss.backward](#1.4 loss.backward)
  • [2. Softmax](#2. Softmax)
    • [2.1 softmax推导](#2.1 softmax推导)

1.loss的种类

常见两种一种是均方差,一种是交叉熵

1.1 MSE

1.2 MSE推导

1.3 autograd.grad

1.4 loss.backward


注意:autograd.grad直接返回梯度,而backward梯度保存再w.grad中

2. Softmax

softmax函数范围是[0,1]所有分类概率和等于1,softmax的特性是使概率大的更大,概率小的更小。

2.1 softmax推导

  • i=j
  • i/=j
  • 。总结
  • 应用
相关推荐
chatblog5 分钟前
Codex /goal:给 AI 一个目标,它自己跑一整天
人工智能
数智工坊5 分钟前
【扩散模型超分开山之作】:SR3扩散模型核心原理与全链路解析
论文阅读·人工智能·深度学习·transformer·迁移学习
云天AI实战派7 分钟前
AI 智能体/API 调用故障排查指南:实时语音、Codex 权限与 Spec 驱动开发全流程修复手册
人工智能·驱动开发·chatgpt·api·codex
谙弆悕博士10 分钟前
Python快速学习——第8章:循环语句
python·学习·servlet
小程故事多_8010 分钟前
生产级大模型应用后端架构设计指南(从入门到实战)
人工智能·架构·智能体
Championship.23.2412 分钟前
AI驱动的网络安全革命:威胁检测与防御实战指南
人工智能·安全·web安全
Swift社区13 分钟前
OpenClaw:AI 多线程时代的开始
人工智能·ai·openclaw
idingzhi14 分钟前
A股量化策略日报(2026年05月09日)
python
Mr数据杨18 分钟前
【Codex】用知识点配置模块构建考试与教学知识图谱
人工智能·django·知识图谱·codex·项目开发
m0_6245785919 分钟前
C#怎么获取U盘的插拔事件_C#如何重写WndProc捕获消息【进阶】
jvm·数据库·python