6.1 感知机
6.1 感知机的概念
感知机
感知机(Perceptron)是一种模拟人脑神经元的线性分类模型,是神经网络的基础结构。
基本概念与历史背景
感知机由美国学者弗兰克·罗森布拉特(Frank Rosenblatt)在1957年提出,是首个可学习的人工神经元模型,用于模拟人脑处理信息的方式。它接收多个输入信号,通过加权求和并加上偏置值,然后经过激活函数输出二分类结果(通常为+1或-1)。感知机的诞生标志着人工智能早期探索的重要进展,并为后续神经网络和机器学习研究奠定了基础。
工作原理
输入层:接收外部信息,不进行处理,只传递给输出层。
加权求和:每个输入信号乘以对应权重后求和。
偏置调整:通过偏置值调整激活阈值。
激活函数:常用阶跃函数,将加权和结果转化为输出信号,实现二分类。
感知机通过迭代更新权重和偏置来最小化误分类损失函数。若训练数据线性可分,感知机可在有限步内收敛到最优解(Novikoff定理)。训练过程核心是错误驱动机制:对每个误分类样本调整权重,使模型逐步逼近正确分类。
局限性与发展
单层感知机只能解决线性可分问题,无法处理非线性问题,如异或(XOR)问题。为解决这一局限,引入了多层感知机(MLP)和核方法,成为现代深度学习的基础。
应用与意义
感知机不仅是神经网络的基础单元,也为支持向量机等线性分类模型提供理论基础。通过理解感知机,可以掌握神经网络的基本组成、工作原理和训练方法,为学习更复杂的深度学习模型打下基础。


6.2 简单逻辑电路
6.2.1 与门

6.2.2 与非门

6.2.3 或门

6.3 感知机的实现

6.4 感知机的局限





6.5 多层感知机

