【数据挖掘-思考】分类和聚类

将芝麻和花生分开,是一个分类问题还是聚类问题?

显而易见的,在日常生活中,这是一个分类问题,在数据挖掘领域中,是否也是这样呢?


通义千问的回答:

在数据挖掘中,将芝麻和花生分开可以根据不同的场景被视为分类或聚类问题:

  • 分类 (Classification): 如果我们已经有了一套标注好的数据集,即一部分芝麻已经被标记为"芝麻",一部分绿豆被标记为"绿豆",并且我们的目标是基于这些已知的样本特征来训练一个模型,以便对新的未标记物品进行预测(判断它是芝麻还是绿豆),那么这个问题就是一个分类问题。
  • 聚类 (Clustering): 如果我们没有预先标记的数据,而是有一堆混在一起的种子,我们希望通过分析种子的大小、颜色、形状等属性,将它们自动分成几组,并且假设这些组能合理地对应到芝麻和绿豆这两类,那么这就是一个聚类问题。聚类旨在根据对象之间的相似性或距离,将它们分组成多个簇,每簇内部的对象相似度较高,而簇间相似度较低。
  • 因此,决定这是分类还是聚类问题的关键在于是否有预定义的类别标签。如果有标签,就是分类;如果没有,而是需要自动发现类别,那就是聚类。

这样学术性的回答好复杂>﹏<

我的老师教给我的:

也就是说,需要训练数据,构建模型的问题是分类问题,很显然这里没有用到,所以是聚类问题。聚类问题关键在于根据某种标准将相似度高的对象分到一起。

你能理解吗?


点赞关注收藏,获取更多干货知识~

相关推荐
Java后端的Ai之路2 小时前
【分析式AI】-分类与回归的区别以及内联
人工智能·分类·数据挖掘·回归·aigc
亿坊电商2 小时前
跨境出口电商系统如何提升出口电商业务的效率和可管理性?
数据挖掘·数据分析·系统架构
六行神算API-天璇2 小时前
技术实践:用大模型平台重构医疗数据分析Pipeline
人工智能·重构·数据挖掘·数据分析
feifeigo1233 小时前
SVM分类在高光谱遥感图像分类与预测中的应用
算法·支持向量机·分类
爱看科技3 小时前
微美全息(NASDAQ:WIMI)量子信息与经典算法融合,开启多类图像分类新征程
算法·分类·量子计算
AAD555888994 小时前
轴体分类识别:基于Decoupled-Solo-Light模型的中心轴、铁质轴和尼龙轴自动检测与分类系统
人工智能·分类·数据挖掘
Dekesas96954 小时前
基于YOLO11-seg的白蚁种类智能识别与分类系统——利用深度学习技术实现白蚁图像分割与多类别精准识别
深度学习·数据挖掘
Dingdangcat865 小时前
篮球场景目标检测与识别实时定位与分类YoloV8分割改进AIFI原创
yolo·目标检测·分类
Dekesas96955 小时前
斑马鱼胚胎发育阶段分类与状态检测_-_基于改进的libra-retinanet算法
目标跟踪·分类
测试人社区-千羽5 小时前
提升软件质量与效率:设计评审的自动化分析与实践路径
运维·人工智能·opencv·安全·数据挖掘·自动化·边缘计算