【深度学习笔记】Softmax 回归

本专栏是网易云课堂人工智能课程《神经网络与深度学习》的学习笔记,视频由网易云课堂与 deeplearning.ai 联合出品,主讲人是吴恩达 Andrew Ng 教授。感兴趣的网友可以观看网易云课堂的视频进行深入学习,视频的链接如下:

神经网络和深度学习 - 网易云课堂

也欢迎对神经网络与深度学习感兴趣的网友一起交流 ~

目录

[1 Softmax 激活函数](#1 Softmax 激活函数)

[2 Softmax 分类器](#2 Softmax 分类器)


1 Softmax 激活函数

对于分类问题,如果有多个分类结果,那么 Logistic 回归就不再适用了。Softmax 回归(Softmax Regression)是 Logistic 回归的一般形式,可以用于区分多个类别的情形,不只是两个分类。

假设有一个图片分类问题,你想要区分小猫、小狗、小鸡,不属于这三种图片的则归于其他。

用 C 表示类别的数量,分类器输出层包含的神经元数量应该等于 C,输出层每个神经元的输出表示该类别的概率值,并且所有输出概率之和应等于 1.

为了做到这一点,你需要使用 Softmax 激活函数,Softmax 激活函数首先对 z 值进行指数运算,得到非负数,然后作归一化处理。

相比其他激活函数,Softmax 激活函数的特殊之处在于,它的输入是一个 Cx1 维的向量,并且它的输出也是一个 Cx1 维的向量。

2 Softmax 分类器

实际上,Softmax 回归是 Logistic 回归的推广,如果分类结果恰好为 2,那么 Softmax 回归就变回到了 Logistic 回归(由于输出概率之和为 1,所以 Softmax 分类有一个输出节点是冗余的)。

Softmax 回归在单个样本上的损失函数定义为

当 yj = 1, j ∈ {0, 1, 2, ... , C-1} 时,其他分量为 0,因此最小化损失函数等价于最大化 log(\hat{y_{j}}),即最大化 \hat{y_{j}},又由于 \hat{y_{j}} 最大值为 1,所以优化算法会尽可能让 \hat{y_{j}} 接近 1,也就是接近 yj .

Softmax 回归在训练集上的代价函数定义为

相关推荐
这张生成的图像能检测吗1 小时前
(论文速读)基于DCP-MobileViT网络的焊接缺陷识别
图像处理·深度学习·计算机视觉·可视化·缺陷识别·焊缝缺陷
hssfscv3 小时前
JAVA学习笔记——集合的概念和习题
笔记·学习
xier_ran3 小时前
深度学习:Mini-Batch 梯度下降(Mini-Batch Gradient Descent)
人工智能·深度学习·batch
AI即插即用5 小时前
即插即用涨点系列 (八):AMDNet 详解!AAAI 2025 SOTA,MLP 融合多尺度分解(MDM)与 AMS 的涨点新范式。
人工智能·pytorch·深度学习·目标检测·计算机视觉·transformer
禾风wyh5 小时前
(ICLR 2019)APPNP传播用 PageRank,不用神经网络!
人工智能·深度学习·神经网络
摇滚侠6 小时前
Vue 项目实战《尚医通》,预约挂号的路由与静态搭建,笔记36
javascript·vue.js·笔记
三品吉他手会点灯6 小时前
STM32F103学习笔记-16-RCC(第4节)-使用 HSI 配置系统时钟并用 MCO 监控系统时钟
笔记·stm32·单片机·嵌入式硬件·学习
Lester_11016 小时前
嵌入式学习笔记 - 关于看门狗定时器的喂狗的操作放在中断还是放在主循环
笔记·单片机·学习
AA陈超7 小时前
ASC学习笔记0017:返回此能力系统组件的所有属性列表
c++·笔记·学习·ue5·虚幻引擎
谅望者8 小时前
数据分析笔记07:Python编程语言介绍
大数据·数据库·笔记·python·数据挖掘·数据分析