深度学习损失函数

目录

一、交叉熵损失函数

二、多分类FocalLoss


一、交叉熵损失函数

对于单个样本其交叉熵误差表示如下:

其中表示分类数量,表示该样本第个分类的真实值(对于one-hot分类而言仅有一个一个分类为1,其他分类为0),表示对第个分类的预测值。进一步对于批量数据(如个样本的情况),需要取每一个样本的误差均值,如下:

考虑到对于one-hot来说仅有一格分类真实值为1,其余为0,那么上式可以重写为:

其中表示该样本对正确分类的预测概率,

二、多分类FocalLoss

因为样本存在不均衡的问题,交叉熵损失训练得到的模型最终容易出现更偏向于"容易的结果",忽略调那些小样本数据。为了解决改问题,需要对不同类别的样本增加权重。考虑基于交叉熵的基础来增加权重,如下式:

其中是用于降低容易预测的样本的权重(也就是大样本数据),因为容易预测的样本的一般比较高,这样使用就会降低这个样本的权重。是根据样本分布的进一步调控。样本分布可以迭代计算得到,如下式:

其中表示平均值,表示次数,表示第次的数量。

相关推荐
天风之翼21 分钟前
搭建一个轻量 Agent Harness——让 AI Agent 安全地执行命令、读写文件
人工智能
雪隐1 小时前
个人电脑玩AI-09让5060 Ti给你打工——让 AI 读懂你的资料
人工智能·后端
大模型真好玩1 小时前
LangChain DeepAgents 速通指南(十)—— DeepAgents Code 智能体服务核心源码解读
人工智能·langchain·agent
网易云信2 小时前
「帝王蟹」企业AI落地实战营西安站落幕:共探“人工智能+”落地深水区
人工智能·agent·产品
阿虎儿2 小时前
本地构建的自定义sandbox-extra镜像推送到沙盒daytona的snapshot列表中
人工智能
网易云信2 小时前
Agent在客服和营销领域走到哪一步了?深度解析3个挑战和5大趋势
人工智能·agent
网易云信2 小时前
AI 融入协作场景,Hermes 接入云信 IM
人工智能·agent
vivo互联网技术3 小时前
ICLR 2026 | 基于后验采样的图像恢复方法LearnIR:人脸去阴影、去雾
人工智能·算法·aigc
饼干哥哥3 小时前
ChatGPT会员掉了,代充黑幕藏不住了
人工智能·操作系统·产品
ZzT3 小时前
Claude Sonnet 5 来了:Opus 级的能力,Sonnet 的价
人工智能·ai编程·claude