【机器学习300问】63、如何区分二分类、多分类和多标签分类?

在机器学习中,分类是指根据一系列特征将实例数据划分到预先定义的类别或者标签的监督学习任务。分类任务按照类别数量区分,可以细分为:

一、二分类(Binary classification)

二分类只有两个类别的分类,例如判断邮件是否为垃圾邮件。

假设我们有一组电影评论数据集, 基于一条用户评论的文字内容,判断其情感倾向为正面(Positive)还是负面(Negative)。我们的目标是构建一个文本分类模型,当给定新的评论时,模型能够准确预测其情感倾向。

二、多分类(Multi-class classification)

多分类相当于从一系列互斥的类别中为每个样本选择唯一的一个类别归属。有两个以上类别的分类,例如识别一张图片是猫、狗还是鸟。

以鸢尾花数据集为例。每朵鸢尾花都是一条数据,包含其萼片长度、宽度等特征信息。目标是根据这些特征,将鸢尾花正确地分类为"山鸢尾"、"变色鸢尾"或"维吉尼亚鸢尾"中的某一类。注意,每朵花只能归属于这三个类别中的一个类别,不存在一朵花同时属于两个或更多类别的情况。

三、多标签分类(Multi-label classification)

多标签分类则是允许一个样本同时关联到多个类别标签,这些标签彼此并不互斥,可以共同描述样本的多元属性或特征。例如电影分类中一部电影可以同时属于喜剧片和动作片。

设想一个音乐流媒体平台,要为一首歌曲分配合适的标签以便用户搜索和推荐。一首歌的数据包括其音频特征、歌词内容、艺术家信息等。标签可能包括"流行"、"摇滚"、"电子"、"抒情"、"舞曲"等。一首歌曲在上传后,系统需要为其打上合适的标签,而实际上,一首歌可能融合了多种风格,比如它既具有强烈的电子节奏,又带有浓厚的流行元素,同时还包含深情的抒情段落。因此,这首歌曲的标签可能是"流行"、"电子"和"抒情",体现了多标签分类的特点,同一歌曲可以同时拥有多个标签。

相关推荐
weixin_4572971017 分钟前
RAG流程全解析:从数据到精准答案
人工智能
whaosoft-14318 分钟前
51c大模型~合集171
人工智能
arron889931 分钟前
YOLOv8n-pose 模型使用
人工智能·深度学习·yolo
AI人工智能+2 小时前
一种融合AI与OCR的施工许可证识别技术,提升工程监管效率,实现自动化、精准化处理。
人工智能·自动化·ocr·施工许可证识别
大力水手(Popeye)3 小时前
Pytorch——tensor
人工智能·pytorch·python
tainshuai4 小时前
用 KNN 算法解锁分类的奥秘:从电影类型到鸢尾花开
算法·分类·数据挖掘
ygy.白茶4 小时前
从电影分类到鸢尾花识别
人工智能
AI_gurubar7 小时前
大模型教机器人叠衣服:2025年”语言理解+多模态融合“的智能新篇
人工智能·机器人
XINVRY-FPGA8 小时前
EPM240T100I5N Altera FPGA MAX II CPLD
人工智能·嵌入式硬件·fpga开发·硬件工程·dsp开发·射频工程·fpga
HuggingFace9 小时前
开源开发者须知:欧盟《人工智能法案》对通用人工智能模型的最新要求
人工智能