人工智能现代方法 第一章绪论 1.3-1.5节
1.3 人工智能的历史
📌 核心脉络:诞生 → 热情高涨 → 现实打击 → 专家系统 → 神经网络回归 → 概率推理 → 大数据 → 深度学习
1.3.1 AI的诞生 (1943---1956)
| 时间 | 人物/事件 | 贡献 |
|---|---|---|
| 1943 | McCulloch & Pitts | 🧠 人工神经元模型:证明任何可计算函数都可通过神经网络实现 |
| 1949 | Donald Hebb | 📚 赫布学习规则:神经元连接强度的更新规则,至今仍有影响 |
| 1950 | Minsky & Edmonds | 🖥️ SNARC:第一台神经网络计算机(40个神经元) |
| 1950 | Alan Turing | 📄 《Computing Machinery and Intelligence》:图灵测试、机器学习、遗传算法 |
| 1956 | 达特茅斯会议 | 🎂 AI正式诞生:麦卡锡、明斯基、香农等10人参与 |
| 1956 | Newell & Simon | 🏆 Logic Theorist:第一个AI程序,证明数学定理 |
1.3.2 早期热情高涨 (1952---1969)
"Look, Ma, no hands!" 时代 ------ 约翰·麦卡锡
核心成就:
┌─────────────────────────────────────────────────────────────┐
│ GPS (通用问题求解器) │
│ └── 模仿人类求解问题的顺序,第一个"人类思维"方式的程序 │
│ │
│ 物理符号系统假说 │
│ └── 任何智能系统必须通过符号结构来运行 │
│ │
│ Lisp语言 (1958, 麦卡锡) │
│ └── 接下来30年最重要的AI编程语言 │
│ │
│ 感知机 (Rosenblatt) │
│ └── 收敛定理:可学习任何能表示的事物 │
└─────────────────────────────────────────────────────────────┘
微世界研究:
- SAINT (1963):解封闭形式微积分问题
- Analogy (1968):解智商测试几何类比
- Student (1967):解代数故事问题
- 积木世界 (Winograd, 1972):自然语言理解 + 规划
1.3.3 一些现实 (1966---1973) ⚠️
西蒙1957年的预测:
"10年内,计算机将成为国际象棋冠军"
实际:用了40年才实现 ❌
失败的两个主要原因:
| 原因 | 说明 |
|---|---|
| 知情内省 | 基于"任务怎么做"而非"算法需要什么才能可靠产生解" |
| 组合爆炸 | 微世界对象少→动作序列短;真实世界→指数增长难处理 |
关键打击:
- 📕 Minsky & Papert《Perceptrons》(1969):证明感知机只能学习线性可分的事物
- 📕 莱特希尔报告 (1973) :英国政府停止AI资助 → 第一次AI寒冬
1.3.4 专家系统 (1969---1986)
核心转变 :弱方法(通用搜索)→ 强方法(领域知识)
"必须差不多知道答案才能解决一个难题"
代表系统:
| 系统 | 领域 | 特点 |
|---|---|---|
| Dendral (1969) | 分子结构推断 | 第一个知识密集型系统,"食谱"式专用规则 |
| Mycin | 血液感染诊断 | 450条规则,引入确定性因子处理不确定性 |
| R1 (1982) | 计算机配置 | 第一个商用专家系统,DEC每年省4000万美元 |
产业高峰:
- 1980年:几百万美元 → 1988年:数十亿美元
- 日本"第五代计算机"计划(预算超130亿美元)
- 几乎每家美国大公司都有AI团队
第二次AI冬天原因:
- 复杂领域难以构建和维护专家系统
- 推理方法在面临不确定性时会崩溃
- 系统无法从经验中学习
1.3.5 神经网络的回归 (1986---现在)
关键突破 :反向传播算法 (back-propagation)
- 1980年代至少4个团队重新发现
- 《Parallel Distributed Processing》(1986) 引起极大轰动
联结主义 vs 符号主义:
| 联结主义 | 符号主义 |
|---|---|
| 神经网络 | 逻辑推理 |
| 从样本学习 | 手工编码 |
| 内部概念流畅 | 公理形式描述 |
| 适配真实世界混乱 | 需要充要条件 |
1.3.6 概率推理和机器学习 (1987---现在)
标志性年份:1988年
| 贡献者 | 成就 |
|---|---|
| Judea Pearl | 《Probabilistic Reasoning in Intelligent Systems》→ 贝叶斯网络 |
| Rich Sutton | 将强化学习与MDP联系起来 |
重要转变:
- AI不再孤立 → 与统计学、运筹学、决策论、控制理论重新联系
- 基于现有理论而非全新理论
- 基于严格定理 和可靠实验
- 展示与真实世界应用的相关性
共享基准问题集出现:
- ImageNet (图像)
- LibriSpeech (语音)
- MNIST (手写数字)
- SQuAD (问答)
- WMT (翻译)
1.3.7 大数据 (2001---现在)
定义:数万亿字的文本、数十亿的图像、数十亿小时的语音和视频...
关键发现:
数据集规模增加2~3个数量级 > 算法改进带来的性能提升
里程碑:
- 2011年:IBM Watson 在《危险边缘》(Jeopardy!) 击败人类冠军
1.3.8 深度学习 (2011---现在) 🔥
定义:使用多层简单、可调整的计算单元的机器学习
关键时间线:
1990s CNN卷积神经网络在手写数字识别取得成功 (LeCun)
↓
2011 深度学习开始流行(语音识别 → 视觉识别)
↓
2012 ImageNet竞赛:深度学习系统大幅领先 ⭐
↓
2016 AlphaGo 击败世界围棋冠军李世石
↓
2017 AlphaZero 自我学习击败所有人类和机器
硬件支撑:
- CPU:10⁹~10¹⁰ 次运算/秒
- GPU/TPU:10¹⁴~10¹⁷ 次运算/秒
- 2012-2018年:训练速度提升 30万倍
1.4 目前的先进技术
AI100报告核心发现
| 指标 | 变化 |
|---|---|
| 📄 论文数量 | 2010-2019增长 20倍 |
| 📰 新闻情绪 | 正面报道从12%→30% |
| 👨🎓 学生注册 | 美国增加5倍,全球增加16倍 |
| 🏢 初创公司 | 增长20倍,达800多家 |
| 🏆 NeurIPS参会 | 增长8倍,达13500人 |
| 👁️ 视觉错误率 | 从28%降到2%(超过人类) |
| 🗣️ 语言问答 | SQuAD从60分→95分 |
AI当前能力一览
┌────────────────────────────────────────────────────────────────┐
│ 🚗 自动驾驶 │
│ • Waymo: 1600万公里,每9650公里才需人类介入一次 │
│ • 商业机器人出租车服务已开始 │
├────────────────────────────────────────────────────────────────┤
│ 🤖 腿足式机器人 │
│ • BigDog/Atlas: 类似动物的步态,可跳跃、后空翻 │
├────────────────────────────────────────────────────────────────┤
│ 🎮 游戏 │
│ • AlphaGo/AlphaZero: 围棋、国际象棋、将棋 │
│ • 《危险边缘》《星际争霸II》《Dota 2》 │
├────────────────────────────────────────────────────────────────┤
│ 🖼️ 图像理解 │
│ • ImageNet物体识别超越人类 │
│ • 复杂场景描述仍有挑战 │
├────────────────────────────────────────────────────────────────┤
│ 🏥 医学诊断 │
│ • 皮肤癌、眼科疾病、乳腺癌等达到专家水平 │
│ • 2017年仅2项FDA批准 → 2018年增至12项 │
├────────────────────────────────────────────────────────────────┤
│ 🌍 气候科学 │
│ • 发现气候数据中隐藏的极端天气信息 │
│ • 60页目录列举机器学习应对气候变化的方式 │
└────────────────────────────────────────────────────────────────┘
人类水平AI何时实现?
| 调查结果 | 预测时间 |
|---|---|
| 专家调查均值 | 2099年 |
| 50%受访者认为 | 2066年 |
| 10%的人认为最早 | 2025年 |
| 少数人认为 | "不可能" |
⚠️ 专家预测并不比业余爱好者更准确
1.5 人工智能的风险和收益
收益 ✅
┌─────────────────────────────────────────────────────────┐
│ 💼 解放重复劳动 → 增加商品和服务的生产 │
│ 🔬 加速科学研究 → 治愈疾病 │
│ 🌍 解决气候变化和资源短缺问题 │
│ 🕊️ 可能预示和平富足时代的到来 │
└─────────────────────────────────────────────────────────┘
DeepMind CEO哈萨比斯:"首先解决人工智能问题,然后再用人工智能解决其他所有问题"
风险 ⚠️
| 风险类型 | 说明 |
|---|---|
| ⚔️ 致命性自主武器 | 无需人类监督即可定位、选择并击杀目标;2017年进入联合国审议 |
| 👁️ 监视和劝诱 | 大规模监视+个性化信息流 → 修改和控制政治行为(如2016年美国大选) |
| ⚖️ 有偏决策 | 假释、贷款等任务中,算法可能因数据偏见产生歧视 |
| 💼 就业影响 | 机器替代工作 vs 创造新工作;财富从劳动力向资本转移 |
| 🚗 安全关键应用 | 驾驶汽车、管理城市供水等已发生致命事故 |
| 🔐 网络安全 | AI用于防御 vs 用于自动化勒索和钓鱼攻击 |
长期风险:超级智能问题
三个层次:
| 概念 | 定义 |
|---|---|
| HLAI (人类级别AI) | 能够学会做人类能做的任何事情 |
| AGI (通用人工智能) | 2008年首次会议 |
| ASI (超级人工智能) | 远超人类智能的AI |
两个核心问题:
🦍 大猩猩问题 (Gorilla Problem)
700万年前,灵长类分支进化为大猩猩和人类
今天,大猩猩无法控制自己的命运
如果AI超越人类...我们会成为"大猩猩"吗?
👑 迈达斯国王问题 (King Midas Problem)
迈达斯要求触碰的一切变成黄金
触碰食物、饮料、家人后...后悔了
→ 将固定目标设定给机器需要重大修改
图灵的早期警告 (1951):
"机器思维方法一旦开始,用不了多久它就会超越我们微弱的力量...
因此,在某个阶段,我们应该期待机器能够受控制。"
解决方向 🎯
核心思路:不是"给机器设定明确目标",而是"让机器努力实现人类目标,但知道它们并不确切知道目标是什么"
| 方法 | 说明 | 章节 |
|---|---|---|
| 目标不确定时谨慎行动 | 机器允许自己关闭 | 第16章 |
| 辅助博弈 | 人类有目标,机器试图实现但不知道目标是什么 | 第18章 |
| 逆向强化学习 | 通过观察人类选择来了解人类偏好 | 第22章 |
小结
┌────────────────────────────────────────────────────────────────┐
│ 📌 核心要点 │
├────────────────────────────────────────────────────────────────┤
│ 1. AI定义的两个关键问题: │
│ • 关心思想还是行为? │
│ • 模拟人类还是追求最佳结果? │
│ │
│ 2. 标准模型:理性行为 = 在某种情况下采取可能的最佳行动 │
│ │
│ 3. 两个改进方向: │
│ • 理性受计算难度限制 │
│ • 目标从"追求明确目标"转变为"造福人类" │
│ │
│ 4. AI历史:成功→盲目乐观→热情丧失→资金削减 的循环 │
│ │
│ 5. 最近几十年:理论和方法已相当成熟 │
│ • 布尔逻辑 → 概率推理 │
│ • 手工编码 → 基于数据的机器学习 │
│ │
│ 6. 必须考虑风险和道德后果 │
│ │
│ 7. 长期挑战:控制超级智能的AI系统 │
│ → 需要改变我们对AI的设想 │
└────────────────────────────────────────────────────────────────┘
图灵奖得主时间线 🏆
| 年份 | 得主 | 贡献 |
|---|---|---|
| 1969 | Marvin Minsky | 表示和推理的领域基础 |
| 1971 | John McCarthy | 表示和推理的领域基础 |
| 1975 | Herbert Simon | 问题求解和人类认知的符号模型 |
| 1994 | Ed Feigenbaum & Raj Reddy | 专家系统 |
| 2011 | Judea Pearl | 概率因果推理 |
| 2018 | Yoshua Bengio, Geoffrey Hinton, Yann LeCun | 深度学习 |
💡 本章核心洞察:AI的历史是一部"螺旋上升"的历史------经历多次热潮与寒冬,但每次回归都站在更高的起点上。当前的深度学习革命建立在数十年的理论积累和硬件进步之上。