第一章_机器学习概述_03.机器学习_算法分类

隔壁大炮2026-04-24 19:50

一、有监督学习 & 无监督学习

有监督学习：输入数据是由输入特征值和目标值所组成，即输入的训练数据有标签的。

无监督学习：输入数据没有被标记，即样本数据类别未知，没有标签，根据样本间的相似性，对样本集聚类，以发现事物内部结构及相互关系。

工作原理：

1、让专家标注少量数据，利用已经标记的数据（也就是带有类标签）训练出一个模型

2、再利用该模型去套用未标记的数据

3、通过询问领域专家分类结果与模型分类结果做对比，从而对模型做进一步改善和提高

思考有什么好处？半监督学习方式可大幅降低标记成本

1、强化学习（Reinforcement Learning）：机器学习的一个重要分支

2、应用场景：里程碑AlphaGo围棋、各类游戏、对抗比赛、无人驾驶场景

3、基本原理：通过构建四个要素：agent，环境状态，行动，奖励，agent根据环境状态进行行动获得最多的累计奖励。

强化学习：寻找最短路径（最优解），以便获得最多的奖励。