深度学习中的MLP层

DeniuHe2026-06-08 19:50

MLP层（深度学习）

MLP = Multi-Layer Perceptron，多层感知机 ，日常也常叫全连接层（Fully Connected Layer, FC），是深度学习最基础的网络层之一。

一、核心定义

由多层神经元全连接 组成的网络结构：上一层每一个神经元 ，都和下一层所有神经元建立连接，没有局部感受野、没有权重共享。

二、结构组成

标准MLP一般包含三部分：

输入层：接收特征向量（一维数据）
隐藏层：一层或多层，搭配激活函数（ReLU、Sigmoid、Tanh等）做非线性变换
输出层：输出最终结果（分类概率、回归数值等）

深度学习里说的 MLP层 ，大多特指全连接层。

三、主要作用

特征融合/映射
把卷积、池化、Transformer等模块提取的高维特征，转换成一维向量，再做特征组合与变换。
维度变换
自由调整特征维度（升维/降维）。
最终分类/回归
网络末尾几乎都用MLP/全连接层输出预测结果（如图像分类、文本分类）。

四、典型使用场景

CNN + MLP
卷积网络提取图像局部特征 → 展平(Flatten) → 接入MLP全连接层 → 分类输出。
Transformer + MLP
NLP/视觉Transformer中，每个编码器/解码器内部都包含Feed-Forward MLP（前馈多层感知机），对语义/视觉特征做非线性转换。
传统表格数据、一维特征任务：直接用纯MLP搭建模型。

五、优缺点

✅ 优点：结构简单、逻辑直观、拟合能力强，擅长处理一维向量特征 。

❌ 缺点：

参数极多，容易过拟合；
不具备局部感知、权重共享，处理图像、长序列等二维/高维数据效率低；
无法保留空间/位置信息。

六、简单示例

输入：1024维特征向量

→ MLP隐藏层（512神经元 + ReLU）

→ MLP输出层（10神经元 + Softmax）

→ 得到10分类结果。

上一篇：LangChain 输出解析器：把模型回复变成你要的数据

下一篇：06Java 异常机制与常用类

热门推荐

01GitHub 镜像站点 022026年7月AI圈大地震：GPT-5.6被政府限制、Claude入驻Slack、Anthropic自研芯片 03如何新建文件夹？电脑新建文件夹的4种方法 04幻兽帕鲁 - 服务器管理员权限与 GM 命令完全指南 05AI科技热点日报 | 2026年07月01日 06国内可直接用、免费额度/永久免费的大模型API清单（含 SiliconFlow、火山、阿里、智谱、百度、Kimi、DeepSeek、DMXAPI 等）072026 国产 AI 大模型横评：DeepSeek、通义千问、Kimi、文心一言、星火、豆包谁更能打？08AI 编程 IDE 全景解析 2026：Agent 全面接管开发链路 09【AI前线观察】2026年国产开源大模型全面横评：从 DeepSeek V4 到 Kimi K3，谁才是开发者的最优选择？102026年AI技术突破与产业落地全景：从GPT-5到多模态智能体的新纪元