pytorch loss及其梯度

目录

  • 1.loss的种类
    • [1.1 MSE](#1.1 MSE)
    • [1.2 MSE推导](#1.2 MSE推导)
    • [1.3 autograd.grad](#1.3 autograd.grad)
    • [1.4 loss.backward](#1.4 loss.backward)
  • [2. Softmax](#2. Softmax)
    • [2.1 softmax推导](#2.1 softmax推导)

1.loss的种类

常见两种一种是均方差,一种是交叉熵

1.1 MSE

1.2 MSE推导

1.3 autograd.grad

1.4 loss.backward


注意:autograd.grad直接返回梯度,而backward梯度保存再w.grad中

2. Softmax

softmax函数范围是[0,1]所有分类概率和等于1,softmax的特性是使概率大的更大,概率小的更小。

2.1 softmax推导

  • i=j
  • i/=j
  • 。总结
  • 应用
相关推荐
Julia | 品牌营销观察员7 小时前
抖音小红书竞品分析用什么软件?2026 实测好用
大数据·人工智能·竞品分析·竞对监测·竞品动态监测
zl_vslam7 小时前
SLAM中的非线性优-3D图优化之IMU预积分SE3推导(二十一)
人工智能·算法·计算机视觉·3d
RFID舜识物联网7 小时前
RFID耐高温标签在汽车喷涂工艺中的创新应用
大数据·人工智能·科技·嵌入式硬件·物联网·汽车
进击的小头7 小时前
第18篇:PID参数整定与裕度优化的现场调试实战
python·算法
青松@FasterAI7 小时前
【动手学大模型】机器何以学习
人工智能·深度学习·神经网络·自然语言处理·大模型开发
lpfasd1237 小时前
Sora 之死:技术理想主义在工程现实主义面前的全面溃败
人工智能
try2find7 小时前
在sft后原lora模型做grpo训练与新增lora层做grpo训练的区别
人工智能
xiaoxiaoxiaolll7 小时前
Nature Communications |石墨烯“解锁”亚太赫兹通信:3Gbit/s高速传输背后的器件创新
网络·人工智能
t198751287 小时前
基于深度学习的图像分割MATLAB实现
人工智能·深度学习·matlab
词元Max7 小时前
1.2 深度学习核心概念:神经网络直觉理解
人工智能·深度学习·神经网络