有监督学习 vs 无监督学习:机器学习的两大支柱

有监督学习 vs 无监督学习:机器学习的两大支柱

有监督学习 vs 无监督学习:机器学习的两大支柱

在机器学习的奇妙世界里,有监督学习和无监督学习就像是两位超级英雄,各自拥有独特的超能力,解决着不同类型的问题。今天,就让我们用通俗易懂的方式来揭开它们神秘的面纱,看看这两者到底有啥区别。

一、有无"老师"来指导

有监督学习像是有一位严格的老师在旁边悉心教导。想象一下,你在学习数学,老师会给你大量的数学题,并且每道题都标好了正确答案(这就是数据集中的标签)。你通过不断地做题,学习题目中的规律(数据特征)和对应的答案,从而掌握解题方法(建立模型)。以后遇到新的题目(新的数据),你就能根据之前学到的经验,给出正确答案(做出预测)。比如在房价预测中,我们有很多房子的信息(面积、房间数、房龄等特征),以及它们实际的售价(标签)。模型通过学习这些带标签的数据,就能预测出其他房子的价格。

而无监督学习则像是没有老师的自习课。你只有一堆数据,没有任何预先给定的答案或标签。你要自己去发现这些数据中的规律和模式。比如,给你一堆不同形状和颜色的积木,你要尝试把它们按照自己发现的相似性(比如颜色相同、形状相似等)分成不同的堆(聚类),但没有人告诉你应该怎么分才是"正确"的,完全靠你自己去探索和发现数据的内在结构。

二、解决的问题类型不同

有监督学习主要用于解决预测和分类问题。预测问题就像我们刚刚说的房价预测,根据已知的房子特征预测价格;分类问题呢,就好比判断一封邮件是垃圾邮件还是正常邮件,模型通过学习已经被标记好的邮件(垃圾邮件或正常邮件)的特征,来对新的邮件进行分类。

无监督学习更多地用于发现数据的内在结构和模式。除了前面提到的聚类,还有数据降维。比如说,我们有一组关于人的数据,包括身高、体重、年龄、收入等很多维度的信息,但有些维度可能是冗余的或者相关性很强。无监督学习可以把这些高维数据降成低维数据,同时尽量保留数据的主要特征,让我们能更直观地看到数据的分布情况,就好像把一个复杂的立体图形投影到一个平面上,虽然损失了一些细节,但主要的形状和结构还是能看清楚。

三、模型的输出不同

有监督学习的输出是明确的预测值或类别标签。比如预测天气,模型会明确告诉你明天是晴天、阴天还是下雨;在手写数字识别中,模型会判断你写的数字是 0、1、2 还是其他数字,给出一个确切的类别。

无监督学习的输出则比较多样化和抽象。聚类的结果是将数据分成不同的组,但这些组的含义可能需要我们进一步去分析和解读;降维后的结果是一组新的低维数据,它能帮助我们更好地可视化和理解原始数据的结构,但不像有监督学习那样直接给出一个具体的预测答案。

总的来说,有监督学习和无监督学习各有所长,在不同的场景下发挥着重要作用。了解它们的区别,能帮助我们根据实际问题选择合适的机器学习方法,就像在不同的战斗中选择合适的超级英雄一样。

版权声明:
原创博主:牛哄哄的柯南
博主原文链接:https://keafmd.blog.csdn.net/
个人博客链接:https://keafmd.top/

**看完如果对你有帮助,感谢点击下面的点赞支持!

哈哈\]\[抱拳\]** ![在这里插入图片描述](https://img-blog.csdnimg.cn/20201023201048810.gif) **加油!** **共同努力!** **Keafmd** **感谢支持牛哄哄的柯南,期待你的三连+关注\~\~** **keep accumulate for my dream【共勉】** ↓ ↓ ↓ 合作 交流 ↓ ↓ ↓

相关推荐
陈壮实的搬砖日记18 分钟前
激活函数为何能增强神经网络的非线性表达能力?
深度学习·算法·机器学习
点云侠21 分钟前
PCL 点云旋转的轴角表示法
人工智能·线性代数·算法·计算机视觉·矩阵
quickeryi21 分钟前
深入浅出AI Agent(What & When)
人工智能
love530love1 小时前
【新手向】GitHub Desktop 的使用说明(含 GitHub Desktop 和 Git 的功能对比)
人工智能·windows·git·python·github
struggle20251 小时前
nn4dms开源程序是用于深度突变扫描数据的神经网络
人工智能·深度学习·神经网络
吹风看太阳1 小时前
机器学习15-XGBoost
人工智能·机器学习·机器人
Code_流苏1 小时前
吴恩达:从斯坦福到 Coursera,他的深度学习布道之路
人工智能·深度学习·机器学习·ai·coursera·吴恩达
一个热爱生活的普通人1 小时前
如何开发一个可以在命令行执行的Coding Agent
人工智能·go·aigc
yzx9910131 小时前
最具有实际意义价值的比赛项目
人工智能·深度学习·机器学习
cylat2 小时前
Day38 Dataset和Dataloader类
人工智能·python·深度学习·神经网络·机器学习