【机器学习300问】63、如何区分二分类、多分类和多标签分类?

在机器学习中,分类是指根据一系列特征将实例数据划分到预先定义的类别或者标签的监督学习任务。分类任务按照类别数量区分,可以细分为:

一、二分类(Binary classification)

二分类只有两个类别的分类,例如判断邮件是否为垃圾邮件。

假设我们有一组电影评论数据集, 基于一条用户评论的文字内容,判断其情感倾向为正面(Positive)还是负面(Negative)。我们的目标是构建一个文本分类模型,当给定新的评论时,模型能够准确预测其情感倾向。

二、多分类(Multi-class classification)

多分类相当于从一系列互斥的类别中为每个样本选择唯一的一个类别归属。有两个以上类别的分类,例如识别一张图片是猫、狗还是鸟。

以鸢尾花数据集为例。每朵鸢尾花都是一条数据,包含其萼片长度、宽度等特征信息。目标是根据这些特征,将鸢尾花正确地分类为"山鸢尾"、"变色鸢尾"或"维吉尼亚鸢尾"中的某一类。注意,每朵花只能归属于这三个类别中的一个类别,不存在一朵花同时属于两个或更多类别的情况。

三、多标签分类(Multi-label classification)

多标签分类则是允许一个样本同时关联到多个类别标签,这些标签彼此并不互斥,可以共同描述样本的多元属性或特征。例如电影分类中一部电影可以同时属于喜剧片和动作片。

设想一个音乐流媒体平台,要为一首歌曲分配合适的标签以便用户搜索和推荐。一首歌的数据包括其音频特征、歌词内容、艺术家信息等。标签可能包括"流行"、"摇滚"、"电子"、"抒情"、"舞曲"等。一首歌曲在上传后,系统需要为其打上合适的标签,而实际上,一首歌可能融合了多种风格,比如它既具有强烈的电子节奏,又带有浓厚的流行元素,同时还包含深情的抒情段落。因此,这首歌曲的标签可能是"流行"、"电子"和"抒情",体现了多标签分类的特点,同一歌曲可以同时拥有多个标签。

相关推荐
Shockang8 小时前
AI 设计工作流全景拆解:Figma MCP / Claude Design / Codex / Google Stitch
人工智能
To_OC10 小时前
数据集划分不是随便切:手把手切分大众点评情感数据集
人工智能·llm·agent
冬奇Lab10 小时前
每日一个开源项目(第142篇):android/skills - Google 官方 Android 开发 AI Skill 库
人工智能·开源·资讯
冬奇Lab11 小时前
Skill 系列(06):Skill 工程化与治理——路由准确率 38%、压缩节省 76%
人工智能·开源·agent
IT_陈寒13 小时前
Vue这个坑我跳了两次,原来问题出在这
前端·人工智能·后端
新新技术迷13 小时前
Node给AI接口做SSE代理与鉴权
人工智能
redreamSo14 小时前
大模型是不是到顶了?瓶颈到底在哪
人工智能·openai
Oo92014 小时前
Tool Use 背后的技术逻辑
人工智能
姗姗来迟了14 小时前
Vue3封装AI流式对话组件踩坑实录
人工智能