全连接神经网络 , 详解 .

用矩阵形式理解全连接网络

偏置矩阵:训练完成后,每个神经元的偏置项 b 会学习到一个具体的数值。这个数值的作用是控制神经元激活的"阈值" ,或者说为模型的输出提供一个"基准线"。在线性变换 z = Wx + b 中,偏置 b 实现了对决策边界的平移(translation) 。这意味着,即使输入 x 为零或很小,神经元也可能因为一个正的偏置值而被激活(例如,在ReLU函数中输出正值),反之亦然。这使得模型的决策边界不必强制通过坐标原点,极大地增强了模型的表达能力


输出:

在图像分类任务中,对于一个需要识别0-9数字的神经网络,其输出确实是十个数值,这十个数值通常被解释为输入图片分别属于这十个类别的概率

具体来说,神经网络的输出层会设计为具有十个神经元,每个神经元对应一个数字类别(0, 1, 2, ..., 9)

。然而,这些神经元直接输出的原始值(通常称为"logits"或"得分")并不能直接作为概率,因为它们可能为任意实数,且总和不一定为1。为了将其转化为符合概率公理(每个值≥0且总和为1)的预测概率分布,需要经过一个称为 Softmax 的激活函数处理。

Softmax函数的工作原理是对每个原始输出值进行指数运算,确保其变为正数,然后除以所有指数值的总和,从而实现归一化

。例如,假设网络最后一层线性运算后的输出向量为 [2.0, 1.0, 0.1, ...],经过Softmax处理后,可能变为 [0.659, 0.288, 0.053, ...]。这表示模型预测该图片是数字"0"的概率为65.9%,是数字"1"的概率为28.8%,是数字"2"的概率为5.3%,以此类推。

相关推荐
科技小花5 小时前
全球化深水区,数据治理成为企业出海 “核心竞争力”
大数据·数据库·人工智能·数据治理·数据中台·全球化
zhuiyisuifeng6 小时前
2026前瞻:GPTimage2镜像官网或将颠覆视觉创作
人工智能·gpt
徐健峰6 小时前
GPT-image-2 热门玩法实战(一):AI 看手相 — 一张手掌照片生成专业手相分析图
人工智能·gpt
weixin_370976356 小时前
AI的终极赛跑:进入AGI,还是泡沫破灭?
大数据·人工智能·agi
Slow菜鸟6 小时前
AI学习篇(五) | awesome-design-md 使用说明
人工智能·学习
冬奇Lab7 小时前
RAG 系列(五):Embedding 模型——语义理解的核心
人工智能·llm·aigc
深小乐7 小时前
AI 周刊【2026.04.27-05.03】:Anthropic 9000亿美元估值、英伟达死磕智能体、中央重磅定调AI
人工智能
码点滴7 小时前
什么时候用 DeepSeek V4,而不是 GPT-5/Claude/Gemini?
人工智能·gpt·架构·大模型·deepseek
狐狐生风7 小时前
LangChain 向量存储:Chroma、FAISS
人工智能·python·学习·langchain·faiss·agentai
波动几何7 小时前
CDA架构代码工坊技能cda-code-lab
人工智能