深度学习损失函数

目录

一、交叉熵损失函数

二、多分类FocalLoss


一、交叉熵损失函数

对于单个样本其交叉熵误差表示如下:

其中表示分类数量,表示该样本第个分类的真实值(对于one-hot分类而言仅有一个一个分类为1,其他分类为0),表示对第个分类的预测值。进一步对于批量数据(如个样本的情况),需要取每一个样本的误差均值,如下:

考虑到对于one-hot来说仅有一格分类真实值为1,其余为0,那么上式可以重写为:

其中表示该样本对正确分类的预测概率,

二、多分类FocalLoss

因为样本存在不均衡的问题,交叉熵损失训练得到的模型最终容易出现更偏向于"容易的结果",忽略调那些小样本数据。为了解决改问题,需要对不同类别的样本增加权重。考虑基于交叉熵的基础来增加权重,如下式:

其中是用于降低容易预测的样本的权重(也就是大样本数据),因为容易预测的样本的一般比较高,这样使用就会降低这个样本的权重。是根据样本分布的进一步调控。样本分布可以迭代计算得到,如下式:

其中表示平均值,表示次数,表示第次的数量。

相关推荐
cyyt3 分钟前
深度学习周报(3.16~3.22)
人工智能
Yeats_Liao5 分钟前
华为开源自研AI框架昇思MindSpore应用案例:WaveNet实现音乐生成
人工智能·深度学习·算法·机器学习·边缘计算
Daydream.V8 分钟前
深度学习详解
人工智能·深度学习
zhangfeng113310 分钟前
LLM 大语言模型 训练的时候 batchsize 调整大导致梯度爆炸问题解决
深度学习·机器学习·语言模型
twc82910 分钟前
RAG核心技术解读
人工智能·深度学习·机器学习
twc82911 分钟前
打造专属 MCP Server 测试自动化的私有化解决方案
运维·软件测试·人工智能·自动化·mcp server
如若12312 分钟前
WSL2 启动报错“拒绝访问“ E_ACCESSDENIED 完整解决方案
人工智能·pytorch·python·深度学习·计算机视觉
洛阳泰山14 分钟前
我用 Java 21 虚拟线程重写了一个 RAG 平台:从架构设计到踩坑实录
java·人工智能·后端
feasibility.17 分钟前
Agent-Reach赋能OpenClaw成为信息管家:实现GitHub/X/b站/小红书等十大平台信息获取(含手动安装)
人工智能·github·微信公众平台·新浪微博·小红书·openclaw·agent-reach
冷雨夜中漫步18 分钟前
AI入门——什么是知识图谱?
人工智能·知识图谱