机器学习、深度学习，向“人类大脑”抄作业

1、人脑的学习方式

你先感受 "难以言说"

你看到一只动物，辨认出这是一只猫，这个过程毫不费力，貌似不需思考。如果让你解释是怎么判断的，你会怎么说？就是人脑的神奇之处，它以一种我们难以言说的方式，高效地解决了极其复杂的问题。

人脑中约有860亿个神经元，每个神经元通过突触接收来自其他神经元的信号，当信号累积超过某个阈值时，就会"激活"并向下一层神经元发送自己的信号。

让计算机也试试？这个问题开启了机器学习与深度学习波澜壮阔的征途。

当你第一次看到一只猫时，大脑并不知道那是什么。但随着你一次次看到猫、并被告诉这是猫，某些神经元之间的连接会逐渐加强------这被称为"突触可塑性"。简单说，一起活跃的神经元会倾向于再次一起活跃。经过足够多的练习，大脑建立了一套识别猫的"内部规则"，虽然你无法把这条规则写下来。

2、波澜壮阔的征途

七十多年前，人工智能蹒跚起步。早期拓荒者试图用逻辑规则还原人类智慧，却在数次"寒冬"中陷入僵局。

破局的，是机器学习。它抛弃了繁琐的手工规则，让机器学会从数据中自我进化。AI 由此真正拥有了"学习"的能力，智能化的大门被推开一道缝隙。

随后，深度学习将这场征途推向顶峰。多层神经网络像剥洋葱一样，洞穿了视觉与语言的复杂特征。从刷脸支付到大模型对话，AI 彻底从实验室飞入寻常百姓家，深刻改写了我们的时代。

2.1关系还是要讲清楚

在计算机科学里，人工智能 ⊃ 机器学习 ⊃ 深度学习

人工智能（AI） ：最外层，统称让机器变聪明的所有技术与思想。

机器学习（ML） ：AI 的一个子集，特指从数据中学习规律 的那一类方法。

深度学习（DL） ：机器学习的一个子集，特指基于深层神经网络的那一类方法。

在人工智能的征途中，机器学习是第一座被征服的高山。它打破了人工规则的局限，让机器拥有了从数据中自主学习的能力。

而深度学习，并不是另一座独立的山，它是机器学习这座山上，拔地而起的最高峰。它用深层神经网络，把机器学习的天花板推到了前所未有的高度。

2.2 认识 "猫"

在深度学习崛起之前，统治江湖的是传统机器学习方法。比如：决策树、向量机等。

教你的孩子认识猫：

传统机器学习方法

人工手动提取特征，人定标准。

你指着猫说："猫有尖耳朵、长胡须..."，让小孩记住这些具体的特征组合。以后看到图片，对照这几条特征，对上就是猫。看到折耳猫、无尾猫时，小朋友可能就犹豫了。

事先定义的特征难全面，这就是特征工程的局限。

深度学习

机器自动挖掘特征，大数据自主学习。

你不需要替他定义任何特征，只是给小孩看猫的图片（成千上万张），每次告诉他"这是猫"。慢慢地，小孩自己就会注意到：耳朵的形状、毛的纹理...，最后形成"猫"的整体概念。他甚至能总结出你从未提及的规律。

传统机器学习方法依赖人事先定义的特征；深度学习自动构建特征层级。

2.3进化之路

机器学习 → 深度学习 的演变，就是这场征途中最关键的一次"进化"。

第一站：符号与规则

智能可以归结为逻辑规则。

如果成绩≥60 -> 及格

这就是符号主义 AI（Symbolism）

我的天，识别猫需要多少条规则？它还没有学习能力。

优点： 逻辑清晰，解释性强。

缺点： 世界太复杂，规则写不完，太多难以言说。

第二站：感知机，向大脑借来的第一颗火种

1958年，心理学家罗森布拉特提出了感知机 ，他不再让机器只按规则，而是模仿生物神经元 ，让机器"像大脑一样"学习。这是历史上第一次真正意义上的"机器学习"。

1969年明斯基和佩珀特的《感知机》一书从数学上证明，单层感知机连"异或"（XOR）这种简单逻辑问题都解决不了。解决异或需要至少两层网络，而当时没有有效的训练方法。

这个致命打击导致神经网络研究几乎停滞，人工智能进入了第一次寒冬（1970s）。大部分研究者转向了所谓的"符号主义"和专家系统。

第三站：专家系统，反弹又跌了

1980年代，人工智能靠专家系统回血。专家系统本质上还是"规则大全"，只是规则更庞大、领域更窄（专科医生）。它一度辉煌，但很快暴露问题：

规则维护成本极高。
无法处理模糊和不确定的情况。

到1980年代末，专家系统泡沫破裂，人工智能进入第二次寒冬。

在此期间，少数坚持神经网络的研究者取得了关键突破。1986年，辛顿等人重新推广了反向传播算法------它最早在1970年代就被提出过，但没有引起重视。反向传播让多层感知机终于可以训练，解决了异或问题，也点燃了现代神经网络的星星之火。然而由于数据匮乏和算力不足，这些成果在当时的工业界影响有限。

第四站：浅层学习，等待时机

1986 年，反向传播算法 复活了神经网络。由于当时算力和数据的限制，网络只能做得很浅------这就是浅层学习（Shallow Learning）。

1990年代到2000年代初，机器学习的主流是"浅层"模型（传统机器学习）。代表有决策树、SVM、随机森林、逻辑回归，以及只有一两层的神经网络。

第五站：深度学习，你悟了

转折定格在 2006 年。

辛顿与萨拉赫丁诺夫提出深度信念网络，独创逐层预训练的训练思路，困住科研多年的多层神经网络难题就此破冰，庞大的深层架构终于可以平稳学习。也正是在这一刻，深度学习一词正式问世，标志着全新技术方向破土萌芽。

技术落地的底气，离不开硬件与数据两大支柱的跨越式革新：GPU 图形处理器跨界入局神经网络训练，算力实现数十倍跃升；以 ImageNet 为代表的海量标注数据集接连问世，补齐了早年稀缺的训练原料。

2012 年成为改写行业的分水岭。

辛顿弟子克里泽夫斯基带队打造的 AlexNet，征战 ImageNet 图像识别赛事，以断层式的优异成绩碾压 SVM 等全部传统浅层算法。这场惊艳赛场的胜利，让学界与产业界达成共识：深度神经网络，真正走通了可行之路。

第六站：深度学习，你太狂了

数据、算力、算法齐活了，2012 年之后，深度学习按下"狂飙"开关。

2014年：生成对抗网络（GAN）诞生，机器能生成逼真图像。

2016年：AlphaGo击败李世石。

2017年：Transformer架构提出，注意力机制成为主流。

2020年代：大语言模型...

你太火热了