机器学习算法分类

文章目录

  • 机器学习算法分类
    • [📊 一、按学习范式分类(主流方式)](#📊 一、按学习范式分类(主流方式))
      • [1. 监督学习(Supervised Learning)](#1. 监督学习(Supervised Learning))
      • [2. 无监督学习(Unsupervised Learning)](#2. 无监督学习(Unsupervised Learning))
      • [3. 半监督学习(Semi-Supervised Learning)](#3. 半监督学习(Semi-Supervised Learning))
      • [4. 强化学习(Reinforcement Learning)](#4. 强化学习(Reinforcement Learning))
    • [🎯 二、按任务目标分类**](#🎯 二、按任务目标分类**)
    • [🧱 三、按模型结构分类](#🧱 三、按模型结构分类)
      • [1. 线性模型](#1. 线性模型)
      • [2. 非线性模型](#2. 非线性模型)
      • [3. 神经网络模型](#3. 神经网络模型)
    • [💎 总结:分类对比与应用选择](#💎 总结:分类对比与应用选择)

机器学习算法分类

机器学习算法根据不同的分类标准可分为多种类型,以下综合多个来源的权威分类方式,从​学习范式 ​、​任务目标 ​和​模型结构​三个核心维度进行系统梳理:

📊 一、按学习范式分类(主流方式)

机器学习学习范式分类 监督学习 无监督学习 半监督学习 强化学习 特点:使用带标签数据训练 任务类型: 分类(离散标签) 回归(连续数值) 典型算法: 逻辑回归、决策树 SVM、线性回归 特点:挖掘无标签数据内在结构 任务类型: 聚类(如K-means) 降维(如PCA) 关联分析(如Apriori) 特点:结合少量标注+大量未标注数据 目标:降低标注成本 算法:标签传播、自训练 特点:智能体通过环境交互学习 核心:奖励机制与策略优化 算法:Q学习、DQN 应用:游戏AI、机器人控制

1. 监督学习(Supervised Learning)

  • 特点​:使用带标签的训练数据(输入-输出对)学习映射关系,预测新数据的标签。

  • 常见算法​:

    • 分类:逻辑回归、决策树、随机森林、支持向量机(SVM)、朴素贝叶斯、K近邻(KNN)。
    • 回归:线性回归、岭回归、Lasso回归、支持向量回归(SVR)。
  • 应用场景​:垃圾邮件识别、信用评分、疾病诊断。

2. 无监督学习(Unsupervised Learning)

  • 特点​:处理无标签数据,挖掘数据内在结构或模式。

  • 任务类型​:

    • 聚类:K-means、层次聚类、DBSCAN(用于客户分群、图像分割)。
    • 降维:主成分分析(PCA)、t-SNE(用于数据可视化、特征压缩)。
    • 关联分析:Apriori(挖掘购物篮规则)。
  • 挑战​:结果可解释性弱,依赖特征有效性。

3. 半监督学习(Semi-Supervised Learning)

  • 特点​:结合少量标注数据和大量未标注数据训练模型,降低标注成本。

  • 算法​:标签传播(Label Propagation)、自训练(Self-training)。

  • ​适用场景​:医学影像分析(标注样本稀缺)。

4. 强化学习(Reinforcement Learning)

  • 特点​:智能体通过环境交互获取奖励信号,学习最优决策策略。

  • ​核心框架​:马尔可夫决策过程(MDP)、Q学习、深度Q网络(DQN)。

  • 应用​:自动驾驶、游戏AI(如AlphaGo)、机器人控制。

🎯 二、按任务目标分类**

​​任务类型​​ ​​目标​​ ​​代表算法​​ ​​典型场景​​
​​分类(Classification)​​ 预测离散类别标签 SVM、决策树、朴素贝叶斯 图像识别、欺诈检测
​​回归(Regression)​​ 预测连续数值 线性回归、随机森林回归 房价预测、销量分析
​​聚类(Clustering)​​ 发现数据自然分组 K-means、DBSCAN 市场细分、社交网络分析
​​降维(Dimensionality Reduction)​​ 压缩特征维度保留关键信息 PCA、t-SNE 数据可视化、特征工程
​​生成(Generation)​​ 生成与训练数据相似的新样本 生成对抗网络(GAN)、变分自编码器(VAE) 图像合成、文本生成

🧱 三、按模型结构分类

1. 线性模型

假设特征与输出呈线性关系(如线性回归、逻辑回归),计算高效但难以处理复杂非线性问题。

2. 非线性模型

  • 核方法​:SVM通过核函数映射到高维空间处理非线性。

  • ​树模型​:决策树通过特征分割处理非线性,衍生算法如随机森林、梯度提升树(GBRT)提升精度。

3. 神经网络模型

  • 基础结构:多层感知机(MLP)、卷积神经网络(CNN)、循环神经网络(RNN)。

  • 优势:自动提取高层次特征,在图像、语音、自然语言处理中表现卓越。

💎 总结:分类对比与应用选择

​​分类维度​​ ​​关键区别​​ ​​典型算法选择建议​​
​​学习范式​​ 数据标签需求与学习目标差异 标签完备选监督学习,探索结构选无监督
​​任务目标​​ 输出类型(离散/连续/结构) 分类任务用SVM,回归任务用岭回归
​​模型复杂度​​ 线性与非线性问题处理能力 简单关系用线性模型,复杂模式用神经网络

💡 ​提示​:实际应用中常需组合多种算法(如聚类后分类),并关注数据特性(如高维数据优先降维)。

相关推荐
二进制person39 分钟前
Java SE--方法的使用
java·开发语言·算法
OneQ6661 小时前
C++讲解---创建日期类
开发语言·c++·算法
JoJo_Way1 小时前
LeetCode三数之和-js题解
javascript·算法·leetcode
.30-06Springfield2 小时前
人工智能概念之七:集成学习思想(Bagging、Boosting、Stacking)
人工智能·算法·机器学习·集成学习
凌肖战4 小时前
力扣网C语言编程题:在数组中查找目标值位置之二分查找法
c语言·算法·leetcode
weixin_478689764 小时前
十大排序算法汇总
java·算法·排序算法
luofeiju4 小时前
使用LU分解求解线性方程组
线性代数·算法
SKYDROID云卓小助手5 小时前
无人设备遥控器之自动调整编码技术篇
人工智能·嵌入式硬件·算法·自动化·信号处理
小陈phd5 小时前
李宏毅机器学习笔记——梯度下降法
人工智能·python·机器学习
ysa0510305 小时前
数论基础知识和模板
数据结构·c++·笔记·算法