111_神经网络的指路明灯:损失函数与反向传播深度解析

如果说神经网络的架构是它的"身体",那么损失函数 就是它的"感官",而反向传播则是它的"进化机制"。通过这两者的结合,模型才能知道自己错在哪里,并朝着正确的方向不断修正。

1. 损失函数的核心作用

损失函数(Loss Function)在训练中扮演着两个至关重要的角色:

  1. 衡量差距:计算实际输出(Outputs)与目标输出(Targets)之间的距离。Loss 越小,说明模型预测越准。
  2. 提供依据:为模型参数的更新提供方向。

2. 常见的损失函数

文件介绍了三种不同场景下的损失函数:

① L1Loss

  • 计算方式:计算预测值与真实值之差的绝对值平均数。
  • 数学公式
  • .

② MSELoss (均方误差)

  • 计算方式:计算差值的平方平均数。
  • 特点:对离群点(误差大的点)非常敏感,误差越大,惩罚越重。

③ CrossEntropyLoss (交叉熵损失)

这是分类任务 中最常用的损失函数。它结合了 LogSoftmaxNLLLoss

  • 作用:衡量两个概率分布之间的差异。当模型对正确类别的预测概率越高,损失值就越低。

3. 反向传播:参数更新的秘密

计算出 Loss 之后,我们该如何调整网络中的权重(Weights)呢?这就是 Backward Propagation 的任务。

核心步骤:

  1. 调用 .backward():当你对 Loss 值调用此方法时,PyTorch 会利用数学中的链式法则 ,自动计算出 Loss 对网络中每个节点(参数)的梯度(Gradient)
  2. 梯度属性 :在反向传播之前,参数的 grad 属性为空;执行后,每个参数都会获得一个梯度值。
  3. 意义:梯度告诉了我们:如果要减小 Loss,这个参数应该往大调还是往小调。

4. 代码实战:在模型中使用损失函数

文件展示了如何在之前搭建的 CIFAR-10 网络中集成损失计算:

Python

复制代码
import torch
from torch import nn

# 1. 定义交叉熵损失函数
loss = nn.CrossEntropyLoss()

# 2. 实例化网络
tudui = Tudui()

# 3. 训练循环模拟
for data in dataloader:
    imgs, targets = data
    
    # 前向传播:得到实际输出
    outputs = tudui(imgs)
    
    # 计算损失:对比输出与目标
    result_loss = loss(outputs, targets)
    
    # 反向传播:计算每个节点的梯度
    result_loss.backward()
    
    # 打印当前的损失值
    print(f"Current Loss: {result_loss.item()}")

5. 总结:训练的闭环逻辑

通过分析该文件,我们补全了模型训练的最后一块拼图:

  1. Forward(前向) :数据流过网络,得到结果,计算 Loss
  2. Backward(反向) :根据 Loss 计算各层的 Gradients(梯度)
  3. Optimize(优化):利用梯度更新权重(下一节内容)。
相关推荐
枫叶林FYL15 小时前
【强化学习】3 双系统持续强化学习:快速迁移与元知识整合架构手册
人工智能·机器学习·架构
1892280486115 小时前
NY382固态MT29F32T08GSLBHL8-24QM:B
大数据·服务器·人工智能·科技·缓存
AI科技星15 小时前
哥德巴赫猜想1+1基于平行素数对等腰梯形网格拓扑与素数渐近密度的大偶数满填充完备性证明
人工智能·线性代数·架构·概率论·学习方法
GIS数据转换器16 小时前
农村生活污水治理智慧管控平台
大数据·人工智能·分布式·数据分析·生活·智慧城市
常威正在打来福16 小时前
frontend-design 入门指南:OpenClaw / Claude Code / Codex 三平台安装教程
人工智能·ai·ai编程
MediaTea16 小时前
AI 术语通俗词典:Dropout 层
人工智能
武子康16 小时前
调查研究-140 全球机器人产业深度调研报告【02篇】:全球机器人产业格局分析:五个阶段并存与商业化路径 2026
人工智能·ai·机器人·具身智能·智能化
木心术116 小时前
Windows系统下MySQL与AI工具集成方案:数据存储与调用实践
人工智能·windows·mysql
a7520662816 小时前
OpenClaw企业微信渠道配置教程|API模式+长连接+全部授权
人工智能·机器人·企业微信·openclaw部署·小龙虾一键安装
AI语宙漫游指南16 小时前
AI Agent Skill 系统架构全解析:SKILL 规范与框架实现
人工智能·agent