机器学习、深度学习,向“人类大脑”抄作业

1、人脑的学习方式

你先感受 "难以言说"

你看到一只动物,辨认出这是一只猫,这个过程毫不费力,貌似不需思考。如果让你解释是怎么判断的,你会怎么说?就是人脑的神奇之处,它以一种我们难以言说的方式,高效地解决了极其复杂的问题。

人脑中约有860亿个神经元,每个神经元通过突触接收来自其他神经元的信号,当信号累积超过某个阈值时,就会"激活"并向下一层神经元发送自己的信号。

让计算机也试试?这个问题开启了机器学习与深度学习波澜壮阔的征途。

当你第一次看到一只猫时,大脑并不知道那是什么。但随着你一次次看到猫、并被告诉这是猫,某些神经元之间的连接会逐渐加强------这被称为"突触可塑性"。简单说,一起活跃的神经元会倾向于再次一起活跃。经过足够多的练习,大脑建立了一套识别猫的"内部规则",虽然你无法把这条规则写下来。

2、波澜壮阔的征途

七十多年前,人工智能蹒跚起步。早期拓荒者试图用逻辑规则还原人类智慧,却在数次"寒冬"中陷入僵局。

破局的,是机器学习。它抛弃了繁琐的手工规则,让机器学会从数据中自我进化。AI 由此真正拥有了"学习"的能力,智能化的大门被推开一道缝隙。

随后,深度学习将这场征途推向顶峰。多层神经网络像剥洋葱一样,洞穿了视觉与语言的复杂特征。从刷脸支付到大模型对话,AI 彻底从实验室飞入寻常百姓家,深刻改写了我们的时代。

2.1关系还是要讲清楚

在计算机科学里,人工智能 ⊃ 机器学习 ⊃ 深度学习

人工智能(AI) :最外层,统称让机器变聪明的所有技术与思想。

机器学习(ML) :AI 的一个子集,特指从数据中学习规律 的那一类方法。

深度学习(DL) :机器学习的一个子集,特指基于深层神经网络的那一类方法。

在人工智能的征途中,机器学习是第一座被征服的高山。 它打破了人工规则的局限,让机器拥有了从数据中自主学习的能力。

而深度学习,并不是另一座独立的山,它是机器学习这座山上,拔地而起的最高峰。 它用深层神经网络,把机器学习的天花板推到了前所未有的高度。

2.2 认识 "猫"

在深度学习崛起之前,统治江湖的是传统机器学习方法。比如:决策树、向量机等。

教你的孩子认识猫:

传统机器学习方法

人工手动提取特征,人定标准。

你指着猫说:"猫有尖耳朵、长胡须...",让小孩记住这些具体的特征组合。以后看到图片,对照这几条特征,对上就是猫。看到折耳猫、无尾猫时,小朋友可能就犹豫了。

事先定义的特征难全面,这就是特征工程的局限。

深度学习

机器自动挖掘特征,大数据自主学习。

你不需要替他定义任何特征,只是给小孩看猫的图片(成千上万张),每次告诉他"这是猫"。慢慢地,小孩自己就会注意到:耳朵的形状、毛的纹理...,最后形成"猫"的整体概念。他甚至能总结出你从未提及的规律。

传统机器学习方法依赖人事先定义的特征;深度学习自动构建特征层级。

2.3进化之路

机器学习 → 深度学习 的演变,就是这场征途中最关键的一次"进化"

第一站:符号与规则

智能可以归结为逻辑规则。

如果 成绩≥60 -> 及格

这就是符号主义 AI(Symbolism)

我的天,识别猫需要多少条规则?它还没有学习能力。

优点: 逻辑清晰,解释性强。

缺点: 世界太复杂,规则写不完,太多难以言说。

第二站:感知机,向大脑借来的第一颗火种

1958年,心理学家罗森布拉特提出了感知机 ,他不再让机器只按规则,而是模仿生物神经元 ,让机器"像大脑一样"学习。这是历史上第一次真正意义上的"机器学习"

1969年明斯基和佩珀特的《感知机》一书从数学上证明,单层感知机连"异或"(XOR)这种简单逻辑问题都解决不了。解决异或需要至少两层网络,而当时没有有效的训练方法。

这个致命打击导致神经网络研究几乎停滞,人工智能进入了第一次寒冬(1970s)。大部分研究者转向了所谓的"符号主义"和专家系统。

第三站:专家系统,反弹又跌了

1980年代,人工智能靠专家系统回血。专家系统本质上还是"规则大全",只是规则更庞大、领域更窄(专科医生)。它一度辉煌,但很快暴露问题:

  • 规则维护成本极高。
  • 无法处理模糊和不确定的情况。

到1980年代末,专家系统泡沫破裂,人工智能进入第二次寒冬。

在此期间,少数坚持神经网络的研究者取得了关键突破。1986年,辛顿等人重新推广了反向传播算法------它最早在1970年代就被提出过,但没有引起重视。反向传播让多层感知机终于可以训练,解决了异或问题,也点燃了现代神经网络的星星之火。然而由于数据匮乏和算力不足,这些成果在当时的工业界影响有限。

第四站:浅层学习,等待时机

1986 年,反向传播算法 复活了神经网络。由于当时算力和数据的限制,网络只能做得很浅------这就是 浅层学习(Shallow Learning)。

1990年代到2000年代初,机器学习的主流是"浅层"模型(传统机器学习)。代表有决策树、SVM、随机森林、逻辑回归,以及只有一两层的神经网络。

第五站:深度学习,你悟了

转折定格在 2006 年。

辛顿与萨拉赫丁诺夫提出深度信念网络,独创逐层预训练的训练思路,困住科研多年的多层神经网络难题就此破冰,庞大的深层架构终于可以平稳学习。也正是在这一刻,深度学习一词正式问世,标志着全新技术方向破土萌芽。

技术落地的底气,离不开硬件与数据两大支柱的跨越式革新:GPU 图形处理器跨界入局神经网络训练,算力实现数十倍跃升;以 ImageNet 为代表的海量标注数据集接连问世,补齐了早年稀缺的训练原料。

2012 年成为改写行业的分水岭。

辛顿弟子克里泽夫斯基带队打造的 AlexNet,征战 ImageNet 图像识别赛事,以断层式的优异成绩碾压 SVM 等全部传统浅层算法。这场惊艳赛场的胜利,让学界与产业界达成共识:深度神经网络,真正走通了可行之路。

第六站:深度学习,你太狂了

数据、算力、算法 齐活了,2012 年之后,深度学习按下"狂飙"开关。

2014年:生成对抗网络(GAN)诞生,机器能生成逼真图像。

2016年:AlphaGo击败李世石。

2017年:Transformer架构提出,注意力机制成为主流。

2020年代:大语言模型...

你太火热了

相关推荐
珠***格2 小时前
四可装置核心技术:高精度采集、边缘计算、协议自适应
大数据·人工智能·分布式·能源·边缘计算
jbk33112 小时前
谷哥找同片助手:相同视频片段自动寻找匹配功能使用说明
人工智能·音视频·剪辑软件·剪映自动化软件
2zcode2 小时前
基于PLC的茶叶加工自动化控制系统设计与实现
人工智能·物联网·自动化
逐梦苍穹2 小时前
Gemma 4 12B本地部署避坑:OMLX后缀、4bit/8bit选择与gemma4_unified报错修复
人工智能·gemma
Hongwen10012 小时前
我是怎么把 AI API 网关服务跑通的:域名、邮件、支付、上游渠道
人工智能
卡梅德生物科技小能手2 小时前
卡美德生物科普:LTA(脂磷壁酸)
人工智能·经验分享·生活
深圳市机智人激光雷达2 小时前
空间几何解算与数字孪生:激光雷达在电力输电通道巡检中的核心机理
人工智能·机器学习·机器人·自动驾驶·无人机
weixin_428005302 小时前
C#调用 AI学习从0开始-第2阶段(Function Calling+工具调用智能体)-第9天实战
人工智能·学习·ai·c#·functioncalling
PKUMOD2 小时前
论文导读 | 智能体技能相关研究分享
人工智能