机器学习算法分类

文章目录

  • 机器学习算法分类
    • [📊 一、按学习范式分类(主流方式)](#📊 一、按学习范式分类(主流方式))
      • [1. 监督学习(Supervised Learning)](#1. 监督学习(Supervised Learning))
      • [2. 无监督学习(Unsupervised Learning)](#2. 无监督学习(Unsupervised Learning))
      • [3. 半监督学习(Semi-Supervised Learning)](#3. 半监督学习(Semi-Supervised Learning))
      • [4. 强化学习(Reinforcement Learning)](#4. 强化学习(Reinforcement Learning))
    • [🎯 二、按任务目标分类**](#🎯 二、按任务目标分类**)
    • [🧱 三、按模型结构分类](#🧱 三、按模型结构分类)
      • [1. 线性模型](#1. 线性模型)
      • [2. 非线性模型](#2. 非线性模型)
      • [3. 神经网络模型](#3. 神经网络模型)
    • [💎 总结:分类对比与应用选择](#💎 总结:分类对比与应用选择)

机器学习算法分类

机器学习算法根据不同的分类标准可分为多种类型,以下综合多个来源的权威分类方式,从​学习范式 ​、​任务目标 ​和​模型结构​三个核心维度进行系统梳理:

📊 一、按学习范式分类(主流方式)

机器学习学习范式分类 监督学习 无监督学习 半监督学习 强化学习 特点:使用带标签数据训练 任务类型: 分类(离散标签) 回归(连续数值) 典型算法: 逻辑回归、决策树 SVM、线性回归 特点:挖掘无标签数据内在结构 任务类型: 聚类(如K-means) 降维(如PCA) 关联分析(如Apriori) 特点:结合少量标注+大量未标注数据 目标:降低标注成本 算法:标签传播、自训练 特点:智能体通过环境交互学习 核心:奖励机制与策略优化 算法:Q学习、DQN 应用:游戏AI、机器人控制

1. 监督学习(Supervised Learning)

  • 特点​:使用带标签的训练数据(输入-输出对)学习映射关系,预测新数据的标签。

  • 常见算法​:

    • 分类:逻辑回归、决策树、随机森林、支持向量机(SVM)、朴素贝叶斯、K近邻(KNN)。
    • 回归:线性回归、岭回归、Lasso回归、支持向量回归(SVR)。
  • 应用场景​:垃圾邮件识别、信用评分、疾病诊断。

2. 无监督学习(Unsupervised Learning)

  • 特点​:处理无标签数据,挖掘数据内在结构或模式。

  • 任务类型​:

    • 聚类:K-means、层次聚类、DBSCAN(用于客户分群、图像分割)。
    • 降维:主成分分析(PCA)、t-SNE(用于数据可视化、特征压缩)。
    • 关联分析:Apriori(挖掘购物篮规则)。
  • 挑战​:结果可解释性弱,依赖特征有效性。

3. 半监督学习(Semi-Supervised Learning)

  • 特点​:结合少量标注数据和大量未标注数据训练模型,降低标注成本。

  • 算法​:标签传播(Label Propagation)、自训练(Self-training)。

  • ​适用场景​:医学影像分析(标注样本稀缺)。

4. 强化学习(Reinforcement Learning)

  • 特点​:智能体通过环境交互获取奖励信号,学习最优决策策略。

  • ​核心框架​:马尔可夫决策过程(MDP)、Q学习、深度Q网络(DQN)。

  • 应用​:自动驾驶、游戏AI(如AlphaGo)、机器人控制。

🎯 二、按任务目标分类**

​​任务类型​​ ​​目标​​ ​​代表算法​​ ​​典型场景​​
​​分类(Classification)​​ 预测离散类别标签 SVM、决策树、朴素贝叶斯 图像识别、欺诈检测
​​回归(Regression)​​ 预测连续数值 线性回归、随机森林回归 房价预测、销量分析
​​聚类(Clustering)​​ 发现数据自然分组 K-means、DBSCAN 市场细分、社交网络分析
​​降维(Dimensionality Reduction)​​ 压缩特征维度保留关键信息 PCA、t-SNE 数据可视化、特征工程
​​生成(Generation)​​ 生成与训练数据相似的新样本 生成对抗网络(GAN)、变分自编码器(VAE) 图像合成、文本生成

🧱 三、按模型结构分类

1. 线性模型

假设特征与输出呈线性关系(如线性回归、逻辑回归),计算高效但难以处理复杂非线性问题。

2. 非线性模型

  • 核方法​:SVM通过核函数映射到高维空间处理非线性。

  • ​树模型​:决策树通过特征分割处理非线性,衍生算法如随机森林、梯度提升树(GBRT)提升精度。

3. 神经网络模型

  • 基础结构:多层感知机(MLP)、卷积神经网络(CNN)、循环神经网络(RNN)。

  • 优势:自动提取高层次特征,在图像、语音、自然语言处理中表现卓越。

💎 总结:分类对比与应用选择

​​分类维度​​ ​​关键区别​​ ​​典型算法选择建议​​
​​学习范式​​ 数据标签需求与学习目标差异 标签完备选监督学习,探索结构选无监督
​​任务目标​​ 输出类型(离散/连续/结构) 分类任务用SVM,回归任务用岭回归
​​模型复杂度​​ 线性与非线性问题处理能力 简单关系用线性模型,复杂模式用神经网络

💡 ​提示​:实际应用中常需组合多种算法(如聚类后分类),并关注数据特性(如高维数据优先降维)。

相关推荐
GalaxyPokemon7 分钟前
LeetCode - 53. 最大子数组和
算法·leetcode·职场和发展
hn小菜鸡42 分钟前
LeetCode 1356.根据数字二进制下1的数目排序
数据结构·算法·leetcode
zhuiQiuMX1 小时前
分享今天做的力扣SQL题
sql·算法·leetcode
music&movie2 小时前
算法工程师认知水平要求总结
人工智能·算法
黑鹿0223 小时前
机器学习基础(四) 决策树
人工智能·决策树·机器学习
laocui13 小时前
Σ∆ 数字滤波
人工智能·算法
大鹏的NLP博客3 小时前
基于 Transformer robert的情感分类任务实践总结之二——R-Drop
分类·transformer·r-dop
yzx9910133 小时前
Linux 系统中的算法技巧与性能优化
linux·算法·性能优化
全栈凯哥4 小时前
Java详解LeetCode 热题 100(26):LeetCode 142. 环形链表 II(Linked List Cycle II)详解
java·算法·leetcode·链表
全栈凯哥4 小时前
Java详解LeetCode 热题 100(27):LeetCode 21. 合并两个有序链表(Merge Two Sorted Lists)详解
java·算法·leetcode·链表