全连接神经网络 , 详解 .

用矩阵形式理解全连接网络

偏置矩阵:训练完成后,每个神经元的偏置项 b 会学习到一个具体的数值。这个数值的作用是控制神经元激活的"阈值" ,或者说为模型的输出提供一个"基准线"。在线性变换 z = Wx + b 中,偏置 b 实现了对决策边界的平移(translation) 。这意味着,即使输入 x 为零或很小,神经元也可能因为一个正的偏置值而被激活(例如,在ReLU函数中输出正值),反之亦然。这使得模型的决策边界不必强制通过坐标原点,极大地增强了模型的表达能力


输出:

在图像分类任务中,对于一个需要识别0-9数字的神经网络,其输出确实是十个数值,这十个数值通常被解释为输入图片分别属于这十个类别的概率

具体来说,神经网络的输出层会设计为具有十个神经元,每个神经元对应一个数字类别(0, 1, 2, ..., 9)

。然而,这些神经元直接输出的原始值(通常称为"logits"或"得分")并不能直接作为概率,因为它们可能为任意实数,且总和不一定为1。为了将其转化为符合概率公理(每个值≥0且总和为1)的预测概率分布,需要经过一个称为 Softmax 的激活函数处理。

Softmax函数的工作原理是对每个原始输出值进行指数运算,确保其变为正数,然后除以所有指数值的总和,从而实现归一化

。例如,假设网络最后一层线性运算后的输出向量为 [2.0, 1.0, 0.1, ...],经过Softmax处理后,可能变为 [0.659, 0.288, 0.053, ...]。这表示模型预测该图片是数字"0"的概率为65.9%,是数字"1"的概率为28.8%,是数字"2"的概率为5.3%,以此类推。

相关推荐
董厂长1 分钟前
规范驱动开发(Spec-Driven Development):一个批判性审视
人工智能·驱动开发
Raink老师2 分钟前
【AI面试临阵磨枪-088】Skill 如何做参数校验、依赖注入、权限控制、超时、重试、幂等?
人工智能·面试·职场和发展
城事漫游Molly4 分钟前
AI与质性研究的融合(三):AI赋能质性数据分析——从编码到理论构建的新范式
大数据·人工智能·机器学习·prompt·ai for science·智能体·定性研究
chenying9981794 分钟前
语音克隆模型的难点之一:音素对齐及交叉注意力早期失效问题 (兼论旋转位置编码)——F5-TTS、SupertonicTTS、VoxFlash-TTS 对比
人工智能·实时音视频·语音合成·tts·语音克隆
凯丨5 分钟前
会“做梦“的 AI:用一句话生成可以玩的世界——读懂世界模型 Genie 3
人工智能·microsoft
踏着七彩祥云的小丑5 分钟前
AI学习——记忆系统
人工智能·学习·ai
ACP广源盛1392462567311 分钟前
GSV2221@ACP# 高带宽低功耗显示转换芯片,赋能 TRAE SOLO 设备高清扩展升级
人工智能·嵌入式硬件·电脑·音视频
大强同学12 分钟前
我用 Claude Code,把 NotebookLM 变成了 Obsidian 插件
人工智能·agent·claude·skill·notebooklm
J2虾虾19 分钟前
Spring AI Alibaba - Memory 短期记忆
人工智能·spring·microsoft
刘一说26 分钟前
AI科技热点日报 | 2026年5月30日
人工智能·科技