【机器学习300问】63、如何区分二分类、多分类和多标签分类?

在机器学习中,分类是指根据一系列特征将实例数据划分到预先定义的类别或者标签的监督学习任务。分类任务按照类别数量区分,可以细分为:

一、二分类(Binary classification)

二分类只有两个类别的分类,例如判断邮件是否为垃圾邮件。

假设我们有一组电影评论数据集, 基于一条用户评论的文字内容,判断其情感倾向为正面(Positive)还是负面(Negative)。我们的目标是构建一个文本分类模型,当给定新的评论时,模型能够准确预测其情感倾向。

二、多分类(Multi-class classification)

多分类相当于从一系列互斥的类别中为每个样本选择唯一的一个类别归属。有两个以上类别的分类,例如识别一张图片是猫、狗还是鸟。

以鸢尾花数据集为例。每朵鸢尾花都是一条数据,包含其萼片长度、宽度等特征信息。目标是根据这些特征,将鸢尾花正确地分类为"山鸢尾"、"变色鸢尾"或"维吉尼亚鸢尾"中的某一类。注意,每朵花只能归属于这三个类别中的一个类别,不存在一朵花同时属于两个或更多类别的情况。

三、多标签分类(Multi-label classification)

多标签分类则是允许一个样本同时关联到多个类别标签,这些标签彼此并不互斥,可以共同描述样本的多元属性或特征。例如电影分类中一部电影可以同时属于喜剧片和动作片。

设想一个音乐流媒体平台,要为一首歌曲分配合适的标签以便用户搜索和推荐。一首歌的数据包括其音频特征、歌词内容、艺术家信息等。标签可能包括"流行"、"摇滚"、"电子"、"抒情"、"舞曲"等。一首歌曲在上传后,系统需要为其打上合适的标签,而实际上,一首歌可能融合了多种风格,比如它既具有强烈的电子节奏,又带有浓厚的流行元素,同时还包含深情的抒情段落。因此,这首歌曲的标签可能是"流行"、"电子"和"抒情",体现了多标签分类的特点,同一歌曲可以同时拥有多个标签。

相关推荐
重生之我要成为代码大佬4 分钟前
深度学习1-安装pytorch(无独立显卡版本)
人工智能·pytorch·深度学习·机器学习
seasonsyy9 分钟前
密码学领域的“三大顶会” & IACR网站简介
人工智能·密码学
烟锁池塘柳013 分钟前
一文总结模型压缩技术:剪枝、量化与蒸馏的原理、实践与工程思考
算法·机器学习·剪枝
Lian_Ge_Blog28 分钟前
微调方法学习总结(万字长文!)
人工智能·深度学习
水月wwww1 小时前
【深度学习】循环神经网络实现文本预测生成
人工智能·rnn·深度学习·gru·lstm·循环神经网络·文本续写
ASD123asfadxv1 小时前
齿轮端面缺陷检测与分类_DINO-4Scale实现与训练_1
人工智能·分类·数据挖掘
汗流浃背了吧,老弟!1 小时前
SFT(监督式微调)
人工智能
zl_vslam1 小时前
SLAM中的非线性优-3D图优化之相对位姿Between Factor位姿图优化(十三)
人工智能·算法·计算机视觉·3d
Xy-unu1 小时前
Analog optical computer for AI inference and combinatorial optimization
论文阅读·人工智能