深度学习损失函数

目录

一、交叉熵损失函数

二、多分类FocalLoss


一、交叉熵损失函数

对于单个样本其交叉熵误差表示如下:

其中表示分类数量,表示该样本第个分类的真实值(对于one-hot分类而言仅有一个一个分类为1,其他分类为0),表示对第个分类的预测值。进一步对于批量数据(如个样本的情况),需要取每一个样本的误差均值,如下:

考虑到对于one-hot来说仅有一格分类真实值为1,其余为0,那么上式可以重写为:

其中表示该样本对正确分类的预测概率,

二、多分类FocalLoss

因为样本存在不均衡的问题,交叉熵损失训练得到的模型最终容易出现更偏向于"容易的结果",忽略调那些小样本数据。为了解决改问题,需要对不同类别的样本增加权重。考虑基于交叉熵的基础来增加权重,如下式:

其中是用于降低容易预测的样本的权重(也就是大样本数据),因为容易预测的样本的一般比较高,这样使用就会降低这个样本的权重。是根据样本分布的进一步调控。样本分布可以迭代计算得到,如下式:

其中表示平均值,表示次数,表示第次的数量。

相关推荐
lqqjuly2 分钟前
前沿算法深度解析(二)
人工智能·算法·机器学习
Bode_20025 分钟前
基于大数据分析的全生命周期质量追溯质量评估体系落地方案
大数据·人工智能
分布式存储与RustFS34 分钟前
RustFS S3 Table 开源后,我重新梳理了一下 Iceberg 数据湖的选型思路
人工智能·开源·minio·dpu·rustfs·ai存储·s3 table
DevOpenClub1 小时前
用 Agent 搭建网页内容采集与结构化处理流水线
人工智能
56AI1 小时前
2026 企业级AI智能体开发平台推荐:聚焦底层安全与准确率的智能体平台
人工智能·安全·智能体
沫儿笙1 小时前
库卡弧焊机器人白车身焊接节气装置
人工智能·机器人
AI智图坊2 小时前
多件装组合SKU图的批量生产效率分析:从PS手工到AI自动化的工作流改造
大数据·运维·人工智能·gpt·ai作画·自动化·aigc
threelab2 小时前
Three.js 物理模拟着色器 | 三维可视化 / AI 提示词
开发语言·前端·javascript·人工智能·3d·着色器
RSTJ_16252 小时前
PYTHON+AI LLM DAY SEVENTY-ONE
人工智能
圣殿骑士-Khtangc2 小时前
单智能体落地实战:从 ReAct 到 Production-Ready AI Agent 全链路解析
人工智能·react.js