【机器学习300问】63、如何区分二分类、多分类和多标签分类?

在机器学习中,分类是指根据一系列特征将实例数据划分到预先定义的类别或者标签的监督学习任务。分类任务按照类别数量区分,可以细分为:

一、二分类(Binary classification)

二分类只有两个类别的分类,例如判断邮件是否为垃圾邮件。

假设我们有一组电影评论数据集, 基于一条用户评论的文字内容,判断其情感倾向为正面(Positive)还是负面(Negative)。我们的目标是构建一个文本分类模型,当给定新的评论时,模型能够准确预测其情感倾向。

二、多分类(Multi-class classification)

多分类相当于从一系列互斥的类别中为每个样本选择唯一的一个类别归属。有两个以上类别的分类,例如识别一张图片是猫、狗还是鸟。

以鸢尾花数据集为例。每朵鸢尾花都是一条数据,包含其萼片长度、宽度等特征信息。目标是根据这些特征,将鸢尾花正确地分类为"山鸢尾"、"变色鸢尾"或"维吉尼亚鸢尾"中的某一类。注意,每朵花只能归属于这三个类别中的一个类别,不存在一朵花同时属于两个或更多类别的情况。

三、多标签分类(Multi-label classification)

多标签分类则是允许一个样本同时关联到多个类别标签,这些标签彼此并不互斥,可以共同描述样本的多元属性或特征。例如电影分类中一部电影可以同时属于喜剧片和动作片。

设想一个音乐流媒体平台,要为一首歌曲分配合适的标签以便用户搜索和推荐。一首歌的数据包括其音频特征、歌词内容、艺术家信息等。标签可能包括"流行"、"摇滚"、"电子"、"抒情"、"舞曲"等。一首歌曲在上传后,系统需要为其打上合适的标签,而实际上,一首歌可能融合了多种风格,比如它既具有强烈的电子节奏,又带有浓厚的流行元素,同时还包含深情的抒情段落。因此,这首歌曲的标签可能是"流行"、"电子"和"抒情",体现了多标签分类的特点,同一歌曲可以同时拥有多个标签。

相关推荐
IT_陈寒5 分钟前
Redis 高并发实战:我从 5000QPS 优化到 5W+ 的7个核心策略
前端·人工智能·后端
北京耐用通信5 分钟前
耐达讯自动化Profibus光纤模块:智能仪表的“生命线”,极端环境通信无忧!
人工智能·物联网·网络协议·自动化·信息与通信
aneasystone本尊12 分钟前
重温 Java 21 之禁用代理的动态加载
人工智能
OpenCSG17 分钟前
CSGHub v1.12.0开源版本更新
人工智能·开源·opencsg·csghub
AI人工智能+28 分钟前
复杂版式下的关键信息抽取:机动车登记证的视觉识别与结构化理解
人工智能·ocr·机动车登记证识别
亚里随笔32 分钟前
突破智能体训练瓶颈:DreamGym如何通过经验合成实现可扩展的强化学习?
人工智能·语言模型·自然语言处理·llm·agentic
跨境卫士苏苏1 小时前
2026 亚马逊生存法则:放弃单点突破,转向多平台全域增长
大数据·人工智能·跨境电商·亚马逊·防关联
工藤学编程1 小时前
零基础学AI大模型之嵌入模型性能优化
人工智能·性能优化
GIOTTO情1 小时前
舆情处置的技术实现:Infoseek 如何用 AI 重构 “识别 - 研判 - 处置” 全链路
人工智能·重构
MaisieKim_1 小时前
如何评估一个新产品机会是否值得投入
大数据·人工智能