人工智能发展历史
1. 萌芽期(1940s--1956)
这是 "AI 还没名字" 的时代,但所有基础思想都在酝酿。
关键人物:
- 艾伦・图灵(Alan Turing)
- 诺伯特・维纳(Norbert Wiener)
- McCulloch & Pitts
关键技术:
-
McCulloch-Pitts 神经元模型(1943)
- 用数学方式描述一个 "神经元" 如何工作
- 输入加权求和 → 阈值激活
- 意义:现代神经网络的起点
-
图灵测试(1950)
- 判断机器是否 "智能" 的行为学标准
- 意义:让 "智能" 有了可操作的定义
-
达特茅斯会议(1956)
- John McCarthy 正式提出 "Artificial Intelligence"
- 意义:AI 作为学科诞生
2. 符号主义 AI(1956--1970)
AI 第一次繁荣,核心是 "用逻辑和规则来模拟推理"。
关键人物:
- John McCarthy
- Marvin Minsky
- Herbert Simon
- Allen Newell
关键技术:
-
Logic Theorist(1956)
- 第一个能证明数学定理的程序
- 意义:证明了 "机器可以做推理"
-
LISP 语言(1958)
- 为符号处理设计的语言
- 意义:AI 研究的主力语言几十年
-
ELIZA(1966)
- 用模式匹配模拟对话
- 意义:第一个聊天机器人,展示 "伪智能" 的可能性
-
SHRDLU(1969)
- 能理解自然语言并操作虚拟积木世界
- 意义:早期 "知识表示 + 推理" 的高峰
3. 第一次 AI 寒冬(1970--1980)
算力不足、数据缺乏,早期方法无法解决复杂问题。
关键技术:
-
专家系统(Expert Systems)萌芽
- 用 "if-then 规则" 模拟专家推理
- 代表:MYCIN(医学诊断)
- 意义:为下一波复兴埋下伏笔
-
知识表示方法
- 框架系统、语义网络
- 意义:尝试让机器拥有 "结构化知识"
4. 知识工程时代(1980--1990)
专家系统在商业上大规模应用,AI 短暂复苏。
关键人物:
- Edward Feigenbaum(知识工程之父)
- Douglas Lenat(Cyc)
关键技术:
-
MYCIN
- 基于规则的医学诊断系统
- 准确率接近人类医生
- 意义:证明 AI 可以在专业领域实用化
-
EMYCIN 等专家系统外壳
- 让企业可以快速构建自己的专家系统
- 意义:AI 第一次商业化
-
Cyc 项目
- 试图构建 "世界知识百科" 级别的知识库
- 意义:早期 "知识图谱" 思想,但规模太大难以维护
5. 第二次 AI 寒冬(1990--2000)
专家系统维护成本爆炸,通用 AI 仍然遥不可及。
关键技术:
-
统计学习方法兴起
- 从 "硬编码规则" 转向 "从数据中学习"
-
支持向量机 SVM(1995)
- 用最大间隔思想做分类
- 理论优美、效果好
- 意义:机器学习进入 "可解释 + 高性能" 时代
6. 统计学习与互联网数据时代(2000--2010)
数据变多,算力提升,机器学习成为主流。
关键人物:
- Yann LeCun
- Geoffrey Hinton
- Yoshua Bengio
- Vladimir Vapnik
关键技术:
-
LeNet-5(1998)
- 卷积神经网络(CNN)的现代雏形
- 用于手写数字识别
- 意义:开启深度学习的视觉时代
-
深度信念网络 DBN(2006)
- Hinton 提出 "逐层预训练"
- 解决了深度网络难以训练的问题
- 意义:深度学习复兴的关键突破
-
ImageNet(2009)
- 大规模图像数据集
- 意义:让视觉模型有足够数据训练
7. 深度学习革命(2010--2020)
这是 AI 真正 "起飞" 的十年。
关键人物:
- Hinton、LeCun、Bengio(深度学习三巨头)
- Ilya Sutskever
- Andrej Karpathy
- Kaiming He
关键技术:
-
AlexNet(2012)
- 在 ImageNet 上把错误率从 26% 降到 15%
- 使用 ReLU、Dropout、数据增强
- 意义:深度学习成为主流
-
生成对抗网络 GAN(2014)
- 生成器 vs 判别器的博弈训练
- 能生成逼真图像
- 意义:开启生成式 AI 时代
-
ResNet(2015)
- 残差连接解决梯度消失
- 可以训练超深网络(152 层)
- 意义:视觉模型性能飞跃
-
Transformer(2017)
- 自注意力机制
- 并行训练效率远高于 RNN
- 意义:NLP 革命的起点,也是大模型的基础
-
BERT(2018)
- 双向预训练
- 在几乎所有 NLP 任务上刷新 SOTA
- 意义:NLP 进入 "预训练 + 微调" 时代
-
GPT-2(2019)
- 大规模自回归语言模型
- 展示了 "大模型 + 无监督学习" 的潜力
- 意义:大语言模型时代的序幕
8. 大模型时代(2020--至今)
大语言模型成为 AI 的核心方向。
关键人物:
- Sam Altman
- Ilya Sutskever
- Demis Hassabis
- Yann LeCun(对大模型持批评态度)
关键技术:
-
GPT-3(2020)
- 1750 亿参数
- 首次展示 "提示词工程" 的强大能力
- 意义:大模型能做 "零样本 / 少样本学习"
-
ChatGPT(2022)
- 在 GPT-3.5 基础上加入 RLHF(人类反馈强化学习)
- 让模型更听话、更安全
- 意义:AI 真正进入大众视野
-
GPT-4(2023)
- 多模态能力
- 更强的推理能力
- 意义:大模型迈向通用智能的重要一步
-
Llama、Claude、Gemini 等模型
- 开源与闭源并存
- 多模态、多任务能力不断增强
-
AI Agent
- 大模型作为 "智能体",能规划、调用工具、执行任务
- 意义:AI 从 "聊天" 走向 "做事"
-
具身智能(Embodied AI)
- AI + 机器人
- 让模型在物理世界中行动
- 意义:AI 开始真正 "进入世界"
9. 未来趋势(2025--)
基于当前时间(2026 年 12 月 19 日)的观察:
- 多模态模型进一步融合(文本、图像、视频、3D)
- AI Agent 成为新的应用范式
- AI + 机器人(具身智能)加速发展
- AI 芯片(GPU/TPU/NPU)竞争加剧
- AI 安全、对齐、可解释性越来越重要
- 更高效的训练与推理技术(如 MoE、稀疏激活)