机器学习—Softmax

Softmax回归算法是Logistic回归的推广,它是一种针对多类分类上下文的二进制分类算法

当y可以接受两个可能的输出值时,Logistic回归就适用了,不是零就是一,它计算这个输出的方式是首先计算z=w*x+b,然后计算a=g(z),它是一个应用于z的Z状结肠函数,把这解释为逻辑回归y=1概率的估计,给定这些输入特性X,如果y=1的概率是0.71,那么y=0的概率是0.29,所以稍微修饰一下逻辑回归,为了将其设置为Softmax回归的泛化,逻辑回归实际上是计算两个数字,也就是之前得到的y=1的概率,用a2=1-a1,也就是y=0的概率,现在将其推广到Softmax回归,当y有四个可能的输出时,所以y可以取1,2,3,4,它将把z计算为w*x+b,这些是Softmax回归的参数,下边是Softmax回归公式a1,作为算法对y=1的几率的估计,Softmax回归的公式将计算一个等式,而在左边,我们写下了Logistic回归模型的规范,右边的方程式是对Softmax回归模型的规范,它有参数w1到w4和b1到b4,如果能学会所有这些参数的适当选择,这就给了你一种预测的方法,给定一组输入特性,X快速测验,假设在一个新的输入X上运行Softmax回归,对于一般情况下的Softmax回归,所以y=1,2,3,.....N,Softmax回归将计算到Zj=Wj*x+bj,现在Softmax回归的参数是w1,w1到wn以及b1,b2到bn,aj被解释为y=j的模型估计,给定输入特征x,最终加起来为1,如果在n=2的情况下应用Softmax回归,所以只有两个可能的输出类,那么Softmax回归最终计算的结果与Logistic回归基本相同,参数最终会有点不同,但它最终简化为一个逻辑回归模型,这就是为什么Softmax回归模型是Logistic回归的推广。

定义了softmax回归如何混淆输出,那么如何指定Softmax回归的成本函数,模型所有参数的成本函数在整个训练集中的平均损失,这就是这个回归的成本函数,写下通常用于Softmax回归的成本函数,我们将在Softmax回归中使用的损失是这样的,如果算法输出一个1到n,地面真相标签是y,如果y=1,损失是负的,所以它是它认为y=1概率的负对数,在本例中,算法的损失是概率的负对数,它以为y=2,以此类推,如果y=j,那么损失函数loss=-log aj ,aj的负对数是一条曲线,如果aj非常接近1,那么会在曲线的右边,而且损失会很小,但如果aj只有50%的机会,就是就大了一点,aj越小损失越大,因此尽可能使aj大,尽可能接近损失小,注意,在这个损失函数中,每一个训练示例只能接收一个值,所以你最终计算出一个aj的负对数,只对aj的值,在那个特定的训练例子中,y=1的实际值是多少。

相关推荐
Raink老师3 小时前
【AI面试临阵磨枪-70】Agent 系统如何做分布式调度、跨服务协作、故障恢复?
人工智能·面试·职场和发展
tedcloud1233 小时前
RTK部署教程:构建稳定的AI Workflow环境
服务器·javascript·人工智能·typescript·ocr
Raink老师4 小时前
【AI面试临阵磨枪-71】如何用 AI 优化推荐系统、内容审核、广告创意、搜索体验?
人工智能·面试·职场和发展
AI医影跨模态组学4 小时前
Biomarker Res(IF=11.5)安徽医科大学第一医院:基于机器学习的放射组学模型:子宫内膜癌患者的预后预测及机制探索
人工智能·深度学习·论文·医学·医学影像·影像组学
ftpeak4 小时前
Mooncake:以 KVCache 为中心的分离式 LLM 服务架构
人工智能·ai·架构·ai编程·ai开发
Terrence Shen4 小时前
Hermes agent的tools是怎么落地应用的系列
人工智能·llm·agent·hermes
Raink老师4 小时前
【AI面试临阵磨枪-72】电商全场景 AI Agent 设计(商品咨询 / 订单 / 物流 / 售后 / 退款)
人工智能·面试·职场和发展
仙女修炼史4 小时前
CNN更看重Texture还是shape:imagenet-trained cnns are biased
论文阅读·人工智能·cnn
视***间4 小时前
视程空间 AIR SC6N0-C-MB NX 16GB 规格详解与机器人/机器狗适配说明
人工智能·机器人·边缘计算·机器狗·ai算力·具身机器人·视程空间
视***间4 小时前
小身板・强算力・全适配 —— 视程空间 AI 算力开发板如何完美适配机器人 / 机器狗
人工智能·机器人·边缘计算·ai算力·视程空间·算力开发板