再说机器学习与深度学习的关系
相关阅读:机器学习与深度学习的关系
1.区分机器学习、人工神经网络、深度学习概念
核心概念关系:同心圆与进化树。把它们想象成一种包含与进化的关系。如图1所示。

图1
-
机器学习(Machine Learning, ML):
- 最大、最古老的概念 。它是人工智能的一个子领域,其核心是 "让计算机从数据中学习规律和模式,而无需进行明确的程序编码"。
- 包含了许多不同的方法,比如决策树、支持向量机(SVM)、朴素贝叶斯、聚类算法(如K-Means)等等。早期的AI研究很多都属于这个范畴。
- 目标:解决分类、回归、聚类等问题。
-
人工神经网络(Artificial Neural Network, ANN):
- 它是机器学习领域内的一大类模型,其设计灵感来源于生物大脑的神经元网络。
- 它由大量相互连接的"神经元"(节点)组成,通过调整神经元之间的连接权重来进行学习。
- 当网络结构比较简单(比如只有输入层、一个隐藏层和输出层)时,我们通常就称之为神经网络 或浅层网络。
-
深度学习(Deep Learning, DL):
- 它是神经网络的一个特定、强大的子集。
- "深度"指的是神经网络的层数非常多(通常不止一个隐藏层,现代网络动辄数十、数百甚至上千层)。
- 深度学习模型能够自动从原始数据(如图像像素、文本字符)中学习并提取多层次的特征表示(底层特征如边缘,中层特征如部件,高层特征如物体整体)。
关系总结 :机器学习 ⊃ 神经网络 ⊃ 深度学习 。
深度学习是"更深的"神经网络,而神经网络是机器学习的一种方法。
2. 发展历程对比:机器学习 vs. 深度神经网络/深度学习
为了让历史脉络更清晰,将这两个交织但侧重点不同的发展线分开:
| 时期 | 机器学习(ML)的发展主线 | 深度神经网络(DNN)/深度学习(DL)的发展主线 |
|---|---|---|
| 1950s-1960s (概念诞生与早期探索) | 核心概念提出 : • 亚瑟·塞缪尔(1959)提出"机器学习"术语。 • 早期算法如决策树(ID3)开始萌芽。 • 统计学方法(如线性回归)被用于数据分析。 | 思想起源与第一次热潮 : • 麦卡洛克&皮茨(1943):MCP神经元模型。 • 罗森布拉特(1958):感知机,第一个可学习的神经网络模型,引发第一次AI乐观期。 |
| 1970s (第一次寒冬) | 受限于计算能力和"知识表示"问题,AI整体(包括ML)进入低谷。但统计学和模式识别理论仍在发展。 | 明斯基&帕普特(1969) 从数学上证明感知机局限,导致神经网络研究几乎停滞,进入严冬。 |
| 1980s-1990s (多元化发展与第二次浪潮) | 百花齐放 : • 统计学习方法成熟:支持向量机(SVM) 、逻辑回归。 • 集成方法如随机森林出现。 • 此时ML的主流是这些"浅层模型",它们在理论完备性和当时的数据量下表现更优。 | 连接主义复兴 : • 反向传播算法(BP) 普及(鲁姆哈特&辛顿等,1986)。 • 卷积神经网络雏形(福岛邦彦,Neocognitron,1980)。 • 应用于手写数字识别 (LeNet-5,1998)。 • 但受算力和数据限制,90年代末再次被SVM等超越。 |
| 2000s (蛰伏与准备) | 继续主导应用 : SVM、提升方法(Boosting)等是工业界和竞赛的冠军模型。大数据时代初现,ML应用日益广泛。 | 黎明前的黑暗 : • 少数研究者坚持,如辛顿在多伦多大学。 • 关键突破 :辛顿等人提出深度信念网络及逐层预训练 (2006),标志着"深度学习"作为一个独立领域的重生。 |
| 2012至今 (深度学习的统治时代) | 融入并成为基础 : 传统ML并未消失,而是用于数据预处理、中小规模数据任务,或与深度学习结合(如图特征+SVM)。 | 爆发与统治 : • 引爆点 :AlexNet 在ImageNet夺冠(2012)。 • 驱动力:大数据 + GPU算力 + 算法改进 (ReLU, Dropout, ResNet等)。 • 核心架构:CNN, RNN/LSTM, Transformer (2017)。 • 应用 :从视觉、语音、NLP横扫几乎所有领域,并催生大语言模型(LLM) 和生成式AI(如GPT、DALL-E)。 |
3. 关键区别与总结
- 范围 :机器学习是一个宽广的领域 ,深度神经网络是其中的一个重要分支。
- 特征工程 :
- 传统ML :严重依赖人工特征工程。例如,要识别图像中的猫,需要先人工设计出能描述边缘、纹理、颜色的特征,再交给SVM等分类器。
- 深度学习 :自动进行特征工程。你只需要输入原始像素,深度网络会自己学习从边缘到猫脸的多层特征表示。
- 数据与算力依赖:深度学习通常是"数据饥渴型"和"算力饥渴型"的,在小数据上传统ML可能更有效。深度学习在拥有海量数据时能展现出惊人的性能。
- 可解释性:传统ML模型(如决策树)通常更易于解释,而深度神经网络常被视为"黑箱",可解释性差。
简单来说:
- 机器学习 是"让机器学会学习的科学",方法多种多样。
- 深度学习 是目前机器学习领域最强大、最主流的方法,它使用深度神经网络这一特定架构来自动学习数据的复杂模式。