机器学习算法分类

文章目录

机器学习算法分类
- [📊 一、按学习范式分类（主流方式）](#📊 一、按学习范式分类（主流方式）)
- - [1. 监督学习（Supervised Learning）](#1. 监督学习（Supervised Learning）)
  - [2. 无监督学习（Unsupervised Learning）](#2. 无监督学习（Unsupervised Learning）)
  - [3. 半监督学习（Semi-Supervised Learning）](#3. 半监督学习（Semi-Supervised Learning）)
  - [4. 强化学习（Reinforcement Learning）](#4. 强化学习（Reinforcement Learning）)
- [🎯 二、按任务目标分类**](#🎯 二、按任务目标分类**)
- [🧱 三、按模型结构分类](#🧱 三、按模型结构分类)
- - [1. 线性模型](#1. 线性模型)
  - [2. 非线性模型](#2. 非线性模型)
  - [3. 神经网络模型](#3. 神经网络模型)
- [💎 总结：分类对比与应用选择](#💎 总结：分类对比与应用选择)

机器学习算法分类

机器学习算法根据不同的分类标准可分为多种类型，以下综合多个来源的权威分类方式，从学习范式 、任务目标 和模型结构三个核心维度进行系统梳理：

📊 一、按学习范式分类（主流方式）

机器学习学习范式分类监督学习无监督学习半监督学习强化学习特点：使用带标签数据训练任务类型：分类（离散标签）回归（连续数值）典型算法：逻辑回归、决策树 SVM、线性回归特点：挖掘无标签数据内在结构任务类型：聚类（如K-means）降维（如PCA）关联分析（如Apriori）特点：结合少量标注+大量未标注数据目标：降低标注成本算法：标签传播、自训练特点：智能体通过环境交互学习核心：奖励机制与策略优化算法：Q学习、DQN 应用：游戏AI、机器人控制

1. 监督学习（Supervised Learning）

特点：使用带标签的训练数据（输入-输出对）学习映射关系，预测新数据的标签。
常见算法：
- 分类：逻辑回归、决策树、随机森林、支持向量机（SVM）、朴素贝叶斯、K近邻（KNN）。
- 回归：线性回归、岭回归、Lasso回归、支持向量回归（SVR）。
应用场景：垃圾邮件识别、信用评分、疾病诊断。

2. 无监督学习（Unsupervised Learning）

特点：处理无标签数据，挖掘数据内在结构或模式。
任务类型：
- 聚类：K-means、层次聚类、DBSCAN（用于客户分群、图像分割）。
- 降维：主成分分析（PCA）、t-SNE（用于数据可视化、特征压缩）。
- 关联分析：Apriori（挖掘购物篮规则）。
挑战：结果可解释性弱，依赖特征有效性。

3. 半监督学习（Semi-Supervised Learning）

特点：结合少量标注数据和大量未标注数据训练模型，降低标注成本。
算法：标签传播（Label Propagation）、自训练（Self-training）。
适用场景：医学影像分析（标注样本稀缺）。

4. 强化学习（Reinforcement Learning）

特点：智能体通过环境交互获取奖励信号，学习最优决策策略。
核心框架：马尔可夫决策过程（MDP）、Q学习、深度Q网络（DQN）。
应用：自动驾驶、游戏AI（如AlphaGo）、机器人控制。

🎯 二、按任务目标分类**

任务类型	目标	代表算法	典型场景
分类（Classification）	预测离散类别标签	SVM、决策树、朴素贝叶斯	图像识别、欺诈检测
回归（Regression）	预测连续数值	线性回归、随机森林回归	房价预测、销量分析
聚类（Clustering）	发现数据自然分组	K-means、DBSCAN	市场细分、社交网络分析
降维（Dimensionality Reduction）	压缩特征维度保留关键信息	PCA、t-SNE	数据可视化、特征工程
生成（Generation）	生成与训练数据相似的新样本	生成对抗网络（GAN）、变分自编码器（VAE）	图像合成、文本生成

🧱 三、按模型结构分类

1. 线性模型

假设特征与输出呈线性关系（如线性回归、逻辑回归），计算高效但难以处理复杂非线性问题。

2. 非线性模型

核方法：SVM通过核函数映射到高维空间处理非线性。
树模型：决策树通过特征分割处理非线性，衍生算法如随机森林、梯度提升树（GBRT）提升精度。

3. 神经网络模型

基础结构：多层感知机（MLP）、卷积神经网络（CNN）、循环神经网络（RNN）。
优势：自动提取高层次特征，在图像、语音、自然语言处理中表现卓越。

💎 总结：分类对比与应用选择

分类维度	关键区别	典型算法选择建议
学习范式	数据标签需求与学习目标差异	标签完备选监督学习，探索结构选无监督
任务目标	输出类型（离散/连续/结构）	分类任务用SVM，回归任务用岭回归
模型复杂度	线性与非线性问题处理能力	简单关系用线性模型，复杂模式用神经网络

💡 提示：实际应用中常需组合多种算法（如聚类后分类），并关注数据特性（如高维数据优先降维）。