监督学习与无监督学习(机器学习初揭秘)

监督学习与无监督学习(机器学习初揭秘)

前言

在如今的机器学习的方式中,监督学习与无监督学习占据了大概80%的部分,他们是最主流最使用的方法,那么这两种训练模式到底是什么,到底有什么区别呢?随着笔者的脚步,往下看看~

一、监督学习

1.1 概念

所谓的监督学习,就是有老师教、有标准答案 的学习方式,它是机器学习里最主流、应用最广的一类,核心就是:给模型一堆「题目 + 答案」,让它学会规律,再去做新题。

下面我们举一个例子,假设我有一个函数 f(x) = kx+b,下面我给几组数值,比如 (1, 2)、(2, 3)、(3, 4) ,随后,我想要大家推测出k 与b的值,那么大家肯定很快可以推测出来,k=1,b=1,这是一道简单的数学题!那么!监督学习就是向机器输入 (1, 2)、(2, 3)、(3, 4)等数据,随后让机器推出kb核心本质:寻找 x→y 的映射函数!

监督学习一般用于有相对正确结果的实验规律统计,比如:肿瘤检测、房价预测、车牌识别、垃圾邮件过滤等!

1.2 监督学习流程

监督学习的流程,可以总结为一句话:喂入「题目 + 答案」→ 模型初步预测 → 计算预测误差 → 调整模型参数 → 反复训练变准 → 对新数据做预测。下面我以图片(豆包AI生成)的方式展现给大家!

1.3 监督学习的优缺点

监督学习的优点:据我的了解,监督学习基于正确的标签(正确的答案),训练的目标清晰,训练起来的目的性比较强,数据利用的效率比较高!

监督学习的缺点:其实不难发现监督学习的方式是基于数据来的,对于数据的依赖性比较大,线性程度比较大,其实就是一种统计,并没有太多的模拟人脑的思考的。


二、无监督学习

1.1 概念

无监督学习与监督学习相对应。监督学习是通过输入带有正确标签(标准答案)的数据,学习从特征 X 到结果 Y 的映射关系;

无监督学习在训练时不提供任何标准答案和标签,仅依靠数据本身的内在特征与分布规律,让算法自动对数据进行分组、归类或提取共性特征,最终形成具有相似特征的数据集合。

无监督学习一般用于无明确结果标注的场景统计,比如:用户分群、商品聚类、异常点检测、数据降维、图像特征提取等!

1.2 无监督学习流程

无监督学习的流程,可以总结为一句话:喂入 [无标签数据]→模型挖掘特征 / 结构→输出聚类 / 降维 / 特征结果→验证 / 应用→反复优化模型。下面我以图文逻辑的方式(图片由豆包AI生成)展现给大家:

1.3 无监督学习的优缺点

无监督学习的优点:无监督学习不用基于标准的正确答案的数据来进行训练,也就是说,无监督学习的学习以及数据成本会降低,并且很大程度可以发掘出人无法发现的特点,有类似大脑一样的思考方式!

无监督学习的缺点 :其实不难发现无监督学习完全依赖数据自身的特征分布,没有标准答案作为参考,结果的可解释性比较弱,本质上是一种 "数据探索性分析",并没有明确的目标导向,也很难直接评估结果的优劣好坏。

图标如下:

维度 监督学习 无监督学习
优点 目标清晰、数据利用效率高、结果易评估 数据 / 学习成本低、可发掘人眼难发现的特征、接近人脑探索方式
缺点 依赖带标签数据、线性统计属性强、缺乏类人脑思考 结果可解释性弱、无明确评估标准、无强目标导向

三、总结及两者对比

可解释性弱、无明确评估标准、无强目标导向 |


三、总结及两者对比

监督学习与无监督学习占据了80%的模型训练部分,是所有机器学习的开始起点,学习与了解这两种机器学习的方式是不可或缺的!

相关推荐
2601_955781981 小时前
本地AI自动化:Windows11 OpenClaw安装全流程详解
人工智能·open claw安装·open claw部署
Magic-Yuan1 小时前
LLM 十大安全风险 - 概述
人工智能·安全
百度Geek说1 小时前
AI Agent 如何重构 App 稳定性治理流程
人工智能
十有八七1 小时前
Hermes Agent 自进化实现:从源码到架构的深度拆解
前端·人工智能
ZFSS1 小时前
PixVerse 视频生成 API 实战教程
人工智能·ai·ai作画·音视频·ai编程
RxGc1 小时前
MCP生态爆发:Anthropic的协议野心与开发者的真实机会
人工智能·mcp
agicall.com1 小时前
信电助 - 智能话务盒 UB-A-XC 型号功能列表
人工智能·语音识别·信创电话助手·固话录音转文字
Dovis(誓平步青云)2 小时前
《如何通过prometheus-webhook-dingtalk解决 Alertmanager 原生不支持钉钉 Webhook问题》
人工智能·生成对抗网络·钉钉·运维开发·prometheus
Jet7692 小时前
Gemini业务复盘上线前怎么做失败样本和成本字段管理
人工智能