PYTHON+AI LLM DAY FOURTY-FIVE

今天系统聊聊深度学习里面的几大损失函数(Loss function).损失函数也叫目标函数,代价函数,误差函数等.损失函数就是用来衡量模型参数质量的函数.具体方式就是比较网络输出和真实输出的差异.当然,优化损失函数的过程就是使得损失函数取得极小值,最终目的是调整模型的最优参数.分类任务的损失函数:多分类交叉熵损失函数(CrossEntrpyLoss).底层默认调用了softmax()激活函数对输入的分数处理,输出的是对标签预测的概率,最终与真实值的比较计算出的损失值.如果是输入的多个样本点的情形,那么默认情况是返回的是这几个样本点的损失值的平均值.当然也可指定sum().二分类交叉熵损失函数BCELoss().与多分类不同,分类的结果只有两种,非此即彼,互为对立关系,正的标签为"1",反的标签为"0",底层选择sigmoid激活函数,输出的是为正例的条件概率,然后根据真实分类,计算损失函数.回归任务的损失函数:平均绝对误差(MAE)损失函数,也叫L1 Loss,L1 Loss的最大问题在于在零点附近,函数值不平滑,梯度消失,直接跳过极小值.平均平方(MSE)损失函数,也叫MSELoss,

MSE Loss的最大问题在于,当误差平方较大的时候,梯度容易爆炸,易受异常值的影响.smoothL1损失函数:它是huber损失函数在δ=1时的情形.摈弃了L1不平滑的部分,用到了MSE的下半段,解决了梯度爆炸和梯度消失的问题.系统介绍损失函数是方便在反向传播过程中对损失函数求梯度,进行参数更新,迭代出最优模型参数.

相关推荐
冬奇Lab8 小时前
Workflow 系列(01):基础理论——三种执行模型与 Anthropic 5 种模式
人工智能·agent·工作流引擎
冬奇Lab8 小时前
每日一个开源项目(第143篇):page-agent - 纯 JS 的网页 GUI Agent,无需截图、无需插件、无需后端
前端·人工智能·agent
程序员cxuan11 小时前
虽迟但到!GPT-5.6 终于来了!
人工智能·后端·程序员
ZhengEnCi13 小时前
Q03-UI设计进阶技巧-让界面更高级的7个核心原则
人工智能
IT_陈寒13 小时前
React的这个渲染问题连官方文档都没说清楚
前端·人工智能·后端
不加辣椒14 小时前
第12章 工具调用与 Agent 提示工程
人工智能
用户16931761726614 小时前
前端给AI消息做日期分组与时间线
人工智能
i晟14 小时前
Claude Code Harness 深度拆解:从你敲回车到模型回复,中间发生了什么
人工智能
用户2527362781415 小时前
【踩坑复盘】我在本地跑 RAG 知识库时踩了 5 个大坑,吐血整理避坑指南
人工智能
大模型真好玩15 小时前
LangChain DeepAgents 速通指南(九)—— 生产级智能体框架 DeepAgents Code 源码导读
人工智能·langchain·agent