一、MLP 是什么?
MLP = Multi-Layer Perceptron = 多层感知机 最简单一句话:把一堆 "神经元" 按层叠起来的神经网络,就是 MLP! 它是最基础、最入门、所有深度学习的起点!
二、用生活比喻秒懂(终身不忘)
把神经网络 比作工厂流水线:
- 输入层 = 原材料入口(比如图像像素、数据特征)
- 隐藏层 = 车间加工层(多层流水线,提取特征)
- 输出层 = 成品出口(分类结果 / 预测值)
- 只有一层加工 = 单层感知机(太简单,只能分简单问题)
- 叠了好几层加工 = MLP(多层感知机)(能解决复杂问题)
三、MLP 的 3 个核心部分(超简单)
1. 全连接层(最核心)
每一层的每个神经元,都和上一层所有神经元相连就像:流水线每一道工序,都能收到上一道所有产品。
2. 多层堆叠
至少1 层输入 + 1 层隐藏 + 1 层输出 你之前代码里写的:输入→隐藏层(Linear+ReLU)→隐藏层(Linear+ReLU)→输出这就是标准 MLP!
3. 激活函数(灵魂)
如果没有激活函数,叠 100 层也等于 1 层 (还是线性的)。激活函数让网络变弯曲、变复杂 ,能学非线性规律。最常用:ReLU(你代码里天天用)
四、MLP 长什么样?(代码对应)
你见过无数次的这个,就是标准 MLP:
python
运行
# 这就是一个 MLP!
net = nn.Sequential(
nn.Linear(784, 256), # 隐藏层1(全连接)
nn.ReLU(), # 激活函数
nn.Linear(256, 128), # 隐藏层2(全连接)
nn.ReLU(),
nn.Linear(128, 10) # 输出层
)
- 输入:784 个特征(比如展平的图片)
- 中间两层:隐藏层(加工特征)
- 输出:10 分类(比如衣服分类)
五、MLP 能干什么?
只要是表格数据、简单图像、数值预测,MLP 都能做:
- 图像分类(Fashion-MNIST)
- 房价预测
- 二分类 / 多分类
- 简单回归任务
六、MLP 的优点缺点(新手必记)
✅ 优点
- 最简单、最容易理解
- 结构清晰、代码好写
- 适合入门、适合表格数据
❌ 缺点
- 处理图片、语音、文本效率低(后来被 CNN、Transformer 取代)
- 层数太多会梯度消失(所以后来有了 ResNet)
七、终极一句话总结(背会就够)
MLP = 多层全连接神经网络 = 深度学习入门第一课 由输入层、隐藏层、输出层堆叠而成,靠激活函数学复杂规律, 是所有复杂模型(CNN、ResNet、UNet)的祖宗!
超简记忆口诀
一层线性太简单, 两层三层变 MLP, 全连接加 ReLU, 入门深度学习就靠它!