机器学习算法分类与数据处理

一、机器学习算法分类

机器学习的核心在于算法，而根据数据集是否有标签，我们可以将机器学习算法分为四大类 。掌握这些分类，就像拥有了机器学习的地图，能让我们在面对不同问题时快速判断方向，而不是盲目选择模型。

机器学习本质上解决的是从数据中学习规律的问题，不同的数据形态决定了我们该用哪种学习方式。

有监督学习是最常见、应用最成熟的一类算法，也是工业界落地最多的一种形式。

定义：输入数据由特征值 和目标值 组成。简单来说，训练数据是带标签的，也就是每条数据都有标准答案。

换句话说，我们是在学习一个从输入到输出的映射关系。

类比：就像学生在老师的指导下学习。老师提供题目（特征）和标准答案（标签），学生通过不断练习，学会看到题目就能写出正确答案。这种有答案参考的学习方式，就是有监督学习。 核心任务：

分类：目标值是离散的（不连续）。例如：垃圾邮件检测（是/否）、图像识别（猫/狗/车）。本质是将样本划分到不同类别。

回归：目标值是连续数值。例如：预测明天的气温、预测房价。本质是预测一个具体数值。

分类预测类别，回归预测数值。

定义：输入数据没有标签。机器只拿到一堆数据，不知道它们代表什么，需要自己去发现数据内部的结构和规律。

类比：就像给小孩一堆积木，不告诉他怎么分类，他可能会根据颜色或形状，自发地分成几堆。这种主动归纳，就是无监督学习的核心。 核心任务：

聚类：根据样本间的相似性，将样本划分为不同组。常见应用包括客户细分 、异常检测。

降维：在保留主要信息的情况下减少特征数量，用于数据压缩或可视化分析。

一句话理解：无监督学习的核心是发现隐藏结构。

背景：现实中数据很多 ，但人工标注成本很高。特别是在医学、语音识别等领域，标注往往需要专业人员参与。

定义：利用少量有标签数据 和大量无标签数据进行训练。

它的核心思想是：用少量人工知识带动大量数据学习。

工作流程：

优势：降低标注成本，同时充分利用海量数据。

定义：一个智能体 在环境中不断尝试，根据获得的奖励或惩罚调整行为策略，目标是最大化累积奖励。

强化学习强调试错机制 和长期收益。

核心四要素：

智能体 ：做出决策的主体，如 AlphaGo、机器人环境：交互场景，如围棋棋盘、迷宫行动：执行的动作，如落子、移动奖励：环境反馈，如 +1 分或 -1 分案例：小孩学走路、训练小狗、本质上都是通过奖励反馈调整行为。