深度学习损失函数

目录

一、交叉熵损失函数

二、多分类FocalLoss


一、交叉熵损失函数

对于单个样本其交叉熵误差表示如下:

其中表示分类数量,表示该样本第个分类的真实值(对于one-hot分类而言仅有一个一个分类为1,其他分类为0),表示对第个分类的预测值。进一步对于批量数据(如个样本的情况),需要取每一个样本的误差均值,如下:

考虑到对于one-hot来说仅有一格分类真实值为1,其余为0,那么上式可以重写为:

其中表示该样本对正确分类的预测概率,

二、多分类FocalLoss

因为样本存在不均衡的问题,交叉熵损失训练得到的模型最终容易出现更偏向于"容易的结果",忽略调那些小样本数据。为了解决改问题,需要对不同类别的样本增加权重。考虑基于交叉熵的基础来增加权重,如下式:

其中是用于降低容易预测的样本的权重(也就是大样本数据),因为容易预测的样本的一般比较高,这样使用就会降低这个样本的权重。是根据样本分布的进一步调控。样本分布可以迭代计算得到,如下式:

其中表示平均值,表示次数,表示第次的数量。

相关推荐
啊巴矲2 小时前
小白从零开始勇闯人工智能:机器学习初级篇(PCA数据降维)
人工智能·机器学习
geneculture2 小时前
融智学形式本体论:一种基于子全域与超子域的统一认知架构
大数据·人工智能·哲学与科学统一性·信息融智学·融智时代(杂志)
笔墨新城2 小时前
Agent Spring Ai 开发之 (一) 基础配置
人工智能·spring·agent
微软技术栈2 小时前
Microsoft AI Genius | 解锁多模态智能体构建,从 0 到 1 极速上手!
人工智能
laplace01232 小时前
# 第六章 agent框架开发实践 - 学习笔记
人工智能·笔记·学习·语言模型·agent
空中楼阁,梦幻泡影2 小时前
LoRA 详细解析,使用LoRA 方式对模型进行微调详细操作指南
运维·服务器·人工智能·机器学习·语言模型
AI即插即用2 小时前
即插即用系列(代码实践)专栏介绍
开发语言·人工智能·深度学习·计算机视觉
Keep__Fighting2 小时前
【神经网络的训练策略选取】
人工智能·深度学习·神经网络·算法
抠头专注python环境配置3 小时前
解决Windows安装PythonOCC报错:从“No module named ‘OCC’ ”到一键成功
人工智能·windows·python·3d·cad·pythonocc