机器学习—多个输出的分类(Optional)

有一种不同类型的分类问题,称为多标签分类问题,与每个图像相关联的地方可能有多个标签。

如果你正在制造一辆自动驾驶汽车或者驾驶辅助系统,然后给你一张车前的照片,你可能想问,比如有没有一辆车或者至少有一辆车还是有公共汽车,还是有行人,所以在这种情况下有一辆车,没有公共汽车,至少有一名行人,或者在第二张照片中,没有车,没有公共汽车,有行人,第三张照片中,有汽车和公共汽车,没有行人,这些是多标签分类问题的例子,因为与单个输入图像x相关联,有三个标签,分别是汽车,公共汽车或行人,所以在这种情况下,目标输出y实际上是一个向量,三个数字,这与多类分类不同,手写数字分类Y只是一个数字,即使这个数字可以有十个不同的可能值。

如何构建多标签分类的神经网络

一种方法是把它看作三个完全独立的机器学习问题,可以建立一个神经网络来决定,第一个检测汽车,第二个检测公交车,第三个是检测行人,这其实不是一个不合理的做法,第一个是检测汽车的神经网络,第二个是检测公交车,第三个检测行人,还有另一种方法,就是训练一个神经网络同时检测三辆车,公共汽车,汽车和行人,如果你的神经网络结构是这样的,X第一隐藏层输出1,第二个隐藏层输出一个2,在这种情况下,最后的输出层会有三个输出神经元,并将输出一个3,它将是一个由三个数字组成的向量,因为正在解决三个二进制分类问题,可以对这三个节点中的每一个节点在输出层使用Z状结肠激活函数,所以在这种情况下,a3分为a31,a32,a33,对应图像中有一辆汽车和一辆公共汽车和行人,因此,多类分类和多标签分类有时会混淆在一起,所以此篇文章只是多标签分类问题的定义。

相关推荐
OpenCSG37 分钟前
对比分析:CSGHub vs. Hugging Face:模型管理平台选型对
人工智能·架构·开源
云上凯歌38 分钟前
传统老旧系统的“AI 涅槃”:从零构建企业级 Agent 集群实战指南
人工智能
cskywit1 小时前
破解红外“魅影”难题:WMRNet 如何以频率分析与二阶差分重塑小目标检测?
人工智能·深度学习
无名修道院1 小时前
AI大模型应用开发-RAG 基础:向量数据库(FAISS/Milvus)、文本拆分、相似性搜索(“让模型查资料再回答”)
人工智能·向量数据库·rag·ai大模型应用开发
自可乐1 小时前
Milvus向量数据库/RAG基础设施学习教程
数据库·人工智能·python·milvus
Loo国昌1 小时前
【大模型应用开发】第二阶段:语义理解应用:文本分类与聚类 (Text Classification & Clustering)
人工智能·分类·聚类
XX風1 小时前
3.2K-means
人工智能·算法·kmeans
feasibility.1 小时前
在OpenCode使用skills搭建基于LLM的dify工作流
人工智能·低代码·docker·ollama·skills·opencode·智能体/工作流
进击monkey2 小时前
PandaWiki:开源企业级AI知识库工具,基于RAG架构的私有化部署方案
人工智能·开源
zy_destiny2 小时前
【工业场景】用YOLOv26实现桥梁检测
人工智能·深度学习·yolo·机器学习·计算机视觉·目标跟踪