1、人脑的学习方式
你先感受 "难以言说"
你看到一只动物,辨认出这是一只猫,这个过程毫不费力,貌似不需思考。如果让你解释是怎么判断的,你会怎么说?就是人脑的神奇之处,它以一种我们难以言说的方式,高效地解决了极其复杂的问题。
人脑中约有860亿个神经元,每个神经元通过突触接收来自其他神经元的信号,当信号累积超过某个阈值时,就会"激活"并向下一层神经元发送自己的信号。
让计算机也试试?这个问题开启了机器学习与深度学习波澜壮阔的征途。
当你第一次看到一只猫时,大脑并不知道那是什么。但随着你一次次看到猫、并被告诉这是猫,某些神经元之间的连接会逐渐加强------这被称为"突触可塑性"。简单说,一起活跃的神经元会倾向于再次一起活跃。经过足够多的练习,大脑建立了一套识别猫的"内部规则",虽然你无法把这条规则写下来。
2、波澜壮阔的征途
七十多年前,人工智能蹒跚起步。早期拓荒者试图用逻辑规则还原人类智慧,却在数次"寒冬"中陷入僵局。
破局的,是机器学习。它抛弃了繁琐的手工规则,让机器学会从数据中自我进化。AI 由此真正拥有了"学习"的能力,智能化的大门被推开一道缝隙。
随后,深度学习将这场征途推向顶峰。多层神经网络像剥洋葱一样,洞穿了视觉与语言的复杂特征。从刷脸支付到大模型对话,AI 彻底从实验室飞入寻常百姓家,深刻改写了我们的时代。
2.1关系还是要讲清楚
在计算机科学里,人工智能 ⊃ 机器学习 ⊃ 深度学习
人工智能(AI) :最外层,统称让机器变聪明的所有技术与思想。
机器学习(ML) :AI 的一个子集,特指从数据中学习规律 的那一类方法。
深度学习(DL) :机器学习的一个子集,特指基于深层神经网络的那一类方法。
在人工智能的征途中,机器学习是第一座被征服的高山。 它打破了人工规则的局限,让机器拥有了从数据中自主学习的能力。
而深度学习,并不是另一座独立的山,它是机器学习这座山上,拔地而起的最高峰。 它用深层神经网络,把机器学习的天花板推到了前所未有的高度。
2.2 认识 "猫"
在深度学习崛起之前,统治江湖的是传统机器学习方法。比如:决策树、向量机等。
教你的孩子认识猫:
传统机器学习方法
人工手动提取特征,人定标准。
你指着猫说:"猫有尖耳朵、长胡须...",让小孩记住这些具体的特征组合。以后看到图片,对照这几条特征,对上就是猫。看到折耳猫、无尾猫时,小朋友可能就犹豫了。
事先定义的特征难全面,这就是特征工程的局限。
深度学习
机器自动挖掘特征,大数据自主学习。
你不需要替他定义任何特征,只是给小孩看猫的图片(成千上万张),每次告诉他"这是猫"。慢慢地,小孩自己就会注意到:耳朵的形状、毛的纹理...,最后形成"猫"的整体概念。他甚至能总结出你从未提及的规律。
传统机器学习方法依赖人事先定义的特征;深度学习自动构建特征层级。
2.3进化之路
机器学习 → 深度学习 的演变,就是这场征途中最关键的一次"进化"。
第一站:符号与规则
智能可以归结为逻辑规则。
如果 成绩≥60 -> 及格
这就是符号主义 AI(Symbolism)
我的天,识别猫需要多少条规则?它还没有学习能力。
优点: 逻辑清晰,解释性强。
缺点: 世界太复杂,规则写不完,太多难以言说。
第二站:感知机,向大脑借来的第一颗火种
1958年,心理学家罗森布拉特提出了感知机 ,他不再让机器只按规则,而是模仿生物神经元 ,让机器"像大脑一样"学习。这是历史上第一次真正意义上的"机器学习"。
1969年明斯基和佩珀特的《感知机》一书从数学上证明,单层感知机连"异或"(XOR)这种简单逻辑问题都解决不了。解决异或需要至少两层网络,而当时没有有效的训练方法。
这个致命打击导致神经网络研究几乎停滞,人工智能进入了第一次寒冬(1970s)。大部分研究者转向了所谓的"符号主义"和专家系统。
第三站:专家系统,反弹又跌了
1980年代,人工智能靠专家系统回血。专家系统本质上还是"规则大全",只是规则更庞大、领域更窄(专科医生)。它一度辉煌,但很快暴露问题:
- 规则维护成本极高。
- 无法处理模糊和不确定的情况。
到1980年代末,专家系统泡沫破裂,人工智能进入第二次寒冬。
在此期间,少数坚持神经网络的研究者取得了关键突破。1986年,辛顿等人重新推广了反向传播算法------它最早在1970年代就被提出过,但没有引起重视。反向传播让多层感知机终于可以训练,解决了异或问题,也点燃了现代神经网络的星星之火。然而由于数据匮乏和算力不足,这些成果在当时的工业界影响有限。
第四站:浅层学习,等待时机
1986 年,反向传播算法 复活了神经网络。由于当时算力和数据的限制,网络只能做得很浅------这就是 浅层学习(Shallow Learning)。
1990年代到2000年代初,机器学习的主流是"浅层"模型(传统机器学习)。代表有决策树、SVM、随机森林、逻辑回归,以及只有一两层的神经网络。
第五站:深度学习,你悟了
转折定格在 2006 年。
辛顿与萨拉赫丁诺夫提出深度信念网络,独创逐层预训练的训练思路,困住科研多年的多层神经网络难题就此破冰,庞大的深层架构终于可以平稳学习。也正是在这一刻,深度学习一词正式问世,标志着全新技术方向破土萌芽。
技术落地的底气,离不开硬件与数据两大支柱的跨越式革新:GPU 图形处理器跨界入局神经网络训练,算力实现数十倍跃升;以 ImageNet 为代表的海量标注数据集接连问世,补齐了早年稀缺的训练原料。
2012 年成为改写行业的分水岭。
辛顿弟子克里泽夫斯基带队打造的 AlexNet,征战 ImageNet 图像识别赛事,以断层式的优异成绩碾压 SVM 等全部传统浅层算法。这场惊艳赛场的胜利,让学界与产业界达成共识:深度神经网络,真正走通了可行之路。
第六站:深度学习,你太狂了
数据、算力、算法 齐活了,2012 年之后,深度学习按下"狂飙"开关。
2014年:生成对抗网络(GAN)诞生,机器能生成逼真图像。
2016年:AlphaGo击败李世石。
2017年:Transformer架构提出,注意力机制成为主流。
2020年代:大语言模型...
你太火热了