深度学习中的MLP层

MLP层(深度学习)

MLP = Multi-Layer Perceptron,多层感知机 ,日常也常叫全连接层(Fully Connected Layer, FC),是深度学习最基础的网络层之一。

一、核心定义

多层神经元全连接 组成的网络结构:上一层每一个神经元 ,都和下一层所有神经元建立连接,没有局部感受野、没有权重共享。

二、结构组成

标准MLP一般包含三部分:

  1. 输入层:接收特征向量(一维数据)
  2. 隐藏层:一层或多层,搭配激活函数(ReLU、Sigmoid、Tanh等)做非线性变换
  3. 输出层:输出最终结果(分类概率、回归数值等)

深度学习里说的 MLP层 ,大多特指全连接层

三、主要作用

  1. 特征融合/映射
    把卷积、池化、Transformer等模块提取的高维特征,转换成一维向量,再做特征组合与变换。
  2. 维度变换
    自由调整特征维度(升维/降维)。
  3. 最终分类/回归
    网络末尾几乎都用MLP/全连接层输出预测结果(如图像分类、文本分类)。

四、典型使用场景

  1. CNN + MLP
    卷积网络提取图像局部特征 → 展平(Flatten) → 接入MLP全连接层 → 分类输出。
  2. Transformer + MLP
    NLP/视觉Transformer中,每个编码器/解码器内部都包含Feed-Forward MLP(前馈多层感知机),对语义/视觉特征做非线性转换。
  3. 传统表格数据、一维特征任务:直接用纯MLP搭建模型。

五、优缺点

✅ 优点:结构简单、逻辑直观、拟合能力强,擅长处理一维向量特征

❌ 缺点:

  • 参数极多,容易过拟合
  • 不具备局部感知、权重共享,处理图像、长序列等二维/高维数据效率低;
  • 无法保留空间/位置信息。

六、简单示例

输入:1024维特征向量

→ MLP隐藏层(512神经元 + ReLU)

→ MLP输出层(10神经元 + Softmax)

→ 得到10分类结果。

相关推荐
巫山老妖9 小时前
置身AI内
人工智能
IT_陈寒11 小时前
JavaScript项目实战经验分享
前端·人工智能·后端
vanuan12 小时前
两个AI智能体第一次对话-A2A双Agent协作实战
人工智能
kfaino14 小时前
码农的AI翻身(四)你好,我叫 Attention
人工智能·后端
雨落Re16 小时前
如何设计一个高质量Skill
人工智能
Token炼金师16 小时前
大模型权重文件全指南:从格式选择到优化实战
人工智能
阿牛哥_GX16 小时前
CDP 浏览器操控原理:让脚本接管你的浏览器
人工智能
ThreeS16 小时前
手搓MiniVLA全实战教程-一步一步用pytorch解释原理与思路
人工智能·python
米小虾17 小时前
Loop Engineering —— 循环的设计与自主执行
人工智能·agent
米小虾17 小时前
Harness Engineering —— 系统的安全护栏
人工智能·agent