机器学习 | 感知机 | 尚硅谷学习

6.1 感知机

6.1 感知机的概念

感知机

感知机(Perceptron)是一种模拟人脑神经元的线性分类模型,是神经网络的基础结构。

基本概念与历史背景

感知机由美国学者弗兰克·罗森布拉特(Frank Rosenblatt)在1957年提出,是首个可学习的人工神经元模型,用于模拟人脑处理信息的方式。它接收多个输入信号,通过加权求和并加上偏置值,然后经过激活函数输出二分类结果(通常为+1或-1)。感知机的诞生标志着人工智能早期探索的重要进展,并为后续神经网络和机器学习研究奠定了基础。

工作原理

输入层:接收外部信息,不进行处理,只传递给输出层。
加权求和:每个输入信号乘以对应权重后求和。

偏置调整:通过偏置值调整激活阈值。
激活函数:常用阶跃函数,将加权和结果转化为输出信号,实现二分类。

感知机通过迭代更新权重和偏置来最小化误分类损失函数。若训练数据线性可分,感知机可在有限步内收敛到最优解(Novikoff定理)。训练过程核心是错误驱动机制:对每个误分类样本调整权重,使模型逐步逼近正确分类。

局限性与发展

单层感知机只能解决线性可分问题,无法处理非线性问题,如异或(XOR)问题。为解决这一局限,引入了多层感知机(MLP)和核方法,成为现代深度学习的基础。

应用与意义

感知机不仅是神经网络的基础单元,也为支持向量机等线性分类模型提供理论基础。通过理解感知机,可以掌握神经网络的基本组成、工作原理和训练方法,为学习更复杂的深度学习模型打下基础。


6.2 简单逻辑电路

6.2.1 与门

6.2.2 与非门

6.2.3 或门

6.3 感知机的实现

6.4 感知机的局限


6.5 多层感知机

相关推荐
ZhengEnCi7 小时前
09c-斯坦福CS336作业二:系统与分布式训练
人工智能
阿里云大数据AI技术8 小时前
用 SQL 解锁多模态数据分析:Hologres 让图片、语音、视频变成结构化洞察
人工智能
阿里云大数据AI技术8 小时前
EMR Serverless StarRocks 湖仓多模态检索:One SQL on One Data,实现全文 + 标量 + 向量三路混合检索
人工智能
冬奇Lab9 小时前
Skill 系列(02):Skill 安全风险——三类攻击面的实战测试
人工智能·安全·开源
冬奇Lab9 小时前
每日一个开源项目(第138篇):OpenMontage - 把 AI 编程助手变成完整的视频制作团队
人工智能·开源·claude
米小虾10 小时前
智谱港股盘中市值突破万亿港元!GLM-5.2 开源引爆国产 AI 价值重估
人工智能·chatglm (智谱)
阿里云大数据AI技术10 小时前
义乌小商品城基于MaxFrame AI Function的亿级AI 数据产线提速之路
人工智能
甲维斯11 小时前
用AI还原《坦克大战》并3D化升级!
前端·人工智能·游戏开发
IT_陈寒12 小时前
SpringBoot自动配置坑了我一晚上,原来问题出在这
前端·人工智能·后端