pytorch loss及其梯度

目录

  • 1.loss的种类
    • [1.1 MSE](#1.1 MSE)
    • [1.2 MSE推导](#1.2 MSE推导)
    • [1.3 autograd.grad](#1.3 autograd.grad)
    • [1.4 loss.backward](#1.4 loss.backward)
  • [2. Softmax](#2. Softmax)
    • [2.1 softmax推导](#2.1 softmax推导)

1.loss的种类

常见两种一种是均方差,一种是交叉熵

1.1 MSE

1.2 MSE推导

1.3 autograd.grad

1.4 loss.backward


注意:autograd.grad直接返回梯度,而backward梯度保存再w.grad中

2. Softmax

softmax函数范围是[0,1]所有分类概率和等于1,softmax的特性是使概率大的更大,概率小的更小。

2.1 softmax推导

  • i=j
  • i/=j
  • 。总结
  • 应用
相关推荐
上海锝秉工控11 小时前
超声波循测仪:工程检测领域的“智慧之眼”
人工智能
地球资源数据云11 小时前
1960年-2024年中国棉花产量数据集
大数据·数据结构·数据仓库·人工智能
eqwaak011 小时前
4月30号(科技信息差)
python·科技·信息可视化·数据挖掘·数据分析
ZGi.ai11 小时前
AI工具泛滥的治理思路:从分散采购到统一底座
人工智能·chatgpt
JaydenAI11 小时前
[MCP在LangChain中的应用-03]在Session构建的上下文中与MCP Server交互
python·langchain·ai编程·ai agent·mcp·fastmcp
AI服务老曹11 小时前
架构实战:基于 GB28181 与 RTSP 的异构设备统一接入方案,深度解析 Docker 化 AI 视频管理平台
人工智能·docker·架构
hhhhhh_we11 小时前
皮肤人格的工程化实现:预颜美历如何用3D点云与循环神经网络构建数字孪生人格
图像处理·人工智能·rnn·深度学习·神经网络·3d·产品运营
Java.熵减码农11 小时前
长文拆解 Karpathy 的 AI 知识库搭建术(Obsidian + Claude Code 完整指南)
人工智能·chatgpt
初圣魔门首席弟子11 小时前
深度学习复习笔记|多层感知机 (MLP):原理 + 从零实现 + 简洁实现
人工智能·笔记·深度学习
X566111 小时前
SQL注入防御技术方案_基于正则表达式的输入清洗
jvm·数据库·python