MLP层(深度学习)
MLP = Multi-Layer Perceptron,多层感知机 ,日常也常叫全连接层(Fully Connected Layer, FC),是深度学习最基础的网络层之一。
一、核心定义
由多层神经元全连接 组成的网络结构:上一层每一个神经元 ,都和下一层所有神经元建立连接,没有局部感受野、没有权重共享。
二、结构组成
标准MLP一般包含三部分:
- 输入层:接收特征向量(一维数据)
- 隐藏层:一层或多层,搭配激活函数(ReLU、Sigmoid、Tanh等)做非线性变换
- 输出层:输出最终结果(分类概率、回归数值等)
深度学习里说的 MLP层 ,大多特指全连接层。
三、主要作用
- 特征融合/映射
把卷积、池化、Transformer等模块提取的高维特征,转换成一维向量,再做特征组合与变换。 - 维度变换
自由调整特征维度(升维/降维)。 - 最终分类/回归
网络末尾几乎都用MLP/全连接层输出预测结果(如图像分类、文本分类)。
四、典型使用场景
- CNN + MLP
卷积网络提取图像局部特征 → 展平(Flatten) → 接入MLP全连接层 → 分类输出。 - Transformer + MLP
NLP/视觉Transformer中,每个编码器/解码器内部都包含Feed-Forward MLP(前馈多层感知机),对语义/视觉特征做非线性转换。 - 传统表格数据、一维特征任务:直接用纯MLP搭建模型。
五、优缺点
✅ 优点:结构简单、逻辑直观、拟合能力强,擅长处理一维向量特征 。
❌ 缺点:
- 参数极多,容易过拟合;
- 不具备局部感知、权重共享,处理图像、长序列等二维/高维数据效率低;
- 无法保留空间/位置信息。
六、简单示例
输入:1024维特征向量
→ MLP隐藏层(512神经元 + ReLU)
→ MLP输出层(10神经元 + Softmax)
→ 得到10分类结果。