机器学习 | 感知机 | 尚硅谷学习

千寻girling2026-05-06 11:59

6.1 感知机

6.1 感知机的概念

感知机

感知机（Perceptron）是一种模拟人脑神经元的线性分类模型，是神经网络的基础结构。

基本概念与历史背景

感知机由美国学者弗兰克·罗森布拉特（Frank Rosenblatt）在1957年提出，是首个可学习的人工神经元模型，用于模拟人脑处理信息的方式。它接收多个输入信号，通过加权求和并加上偏置值，然后经过激活函数输出二分类结果（通常为+1或-1）。感知机的诞生标志着人工智能早期探索的重要进展，并为后续神经网络和机器学习研究奠定了基础。

工作原理

输入层：接收外部信息，不进行处理，只传递给输出层。
加权求和：每个输入信号乘以对应权重后求和。

偏置调整：通过偏置值调整激活阈值。
激活函数：常用阶跃函数，将加权和结果转化为输出信号，实现二分类。

感知机通过迭代更新权重和偏置来最小化误分类损失函数。若训练数据线性可分，感知机可在有限步内收敛到最优解（Novikoff定理）。训练过程核心是错误驱动机制：对每个误分类样本调整权重，使模型逐步逼近正确分类。

局限性与发展

单层感知机只能解决线性可分问题，无法处理非线性问题，如异或（XOR）问题。为解决这一局限，引入了多层感知机（MLP）和核方法，成为现代深度学习的基础。

应用与意义

感知机不仅是神经网络的基础单元，也为支持向量机等线性分类模型提供理论基础。通过理解感知机，可以掌握神经网络的基本组成、工作原理和训练方法，为学习更复杂的深度学习模型打下基础。