机器学习 | 感知机 | 尚硅谷学习

6.1 感知机

6.1 感知机的概念

感知机

感知机(Perceptron)是一种模拟人脑神经元的线性分类模型,是神经网络的基础结构。

基本概念与历史背景

感知机由美国学者弗兰克·罗森布拉特(Frank Rosenblatt)在1957年提出,是首个可学习的人工神经元模型,用于模拟人脑处理信息的方式。它接收多个输入信号,通过加权求和并加上偏置值,然后经过激活函数输出二分类结果(通常为+1或-1)。感知机的诞生标志着人工智能早期探索的重要进展,并为后续神经网络和机器学习研究奠定了基础。

工作原理

输入层:接收外部信息,不进行处理,只传递给输出层。
加权求和:每个输入信号乘以对应权重后求和。

偏置调整:通过偏置值调整激活阈值。
激活函数:常用阶跃函数,将加权和结果转化为输出信号,实现二分类。

感知机通过迭代更新权重和偏置来最小化误分类损失函数。若训练数据线性可分,感知机可在有限步内收敛到最优解(Novikoff定理)。训练过程核心是错误驱动机制:对每个误分类样本调整权重,使模型逐步逼近正确分类。

局限性与发展

单层感知机只能解决线性可分问题,无法处理非线性问题,如异或(XOR)问题。为解决这一局限,引入了多层感知机(MLP)和核方法,成为现代深度学习的基础。

应用与意义

感知机不仅是神经网络的基础单元,也为支持向量机等线性分类模型提供理论基础。通过理解感知机,可以掌握神经网络的基本组成、工作原理和训练方法,为学习更复杂的深度学习模型打下基础。


6.2 简单逻辑电路

6.2.1 与门

6.2.2 与非门

6.2.3 或门

6.3 感知机的实现

6.4 感知机的局限


6.5 多层感知机

相关推荐
南河的南1 小时前
RAG项目总结
人工智能
大模型真好玩1 小时前
LangChain DeepAgents 速通指南(八)—— DeepAgents流式输出详解
人工智能·langchain·agent
码上掘金1 小时前
基于 YOLO 的小麦麦穗检测系统的设计与实现
人工智能·yolo·语言模型
沪漂阿龙1 小时前
AI Agent爆火,但你真的懂LangChain吗?——大模型智能体开发完全指南
人工智能·langchain
可爱の小公举1 小时前
Java 后端程序员转 AI Agent 工程师:一条可执行学习路线
java·人工智能·学习
华盛AI1 小时前
DeepSeek新一代大模型DeepSeek V4深度调研分析
人工智能
良木生香1 小时前
【Linux系统编程】Linux基础指令(1)---一文带你了解Linux的基础指令
linux·运维·服务器·ubuntu·机器学习·系统架构·centos
Cx330❀1 小时前
深度解析:从原理到实战,一文吃透 Linux 信号机制(上)
大数据·linux·运维·服务器·人工智能·elasticsearch
源于花海1 小时前
模型独立的学习方式——自训练
深度学习·机器学习·自训练