【目标检测】yolo的三种数据集格式

目标检测中数据集格式之间的相互转换--coco、voc、yolohttps://zhuanlan.zhihu.com/p/461488682?utm_medium=social&utm_psn=1825483604463071232&utm_source=wechat_session【目标检测】yolo的三种数据集格式https://zhuanlan.zhihu.com/p/525950939?utm_medium=social&utm_psn=1825483832641581056&utm_source=wechat_session

在YOLO目标检测中,常用的标签格式主要有三种:voc(xml)、coco(json)和yolo(txt)。每种格式都有其独特的优点和适用场景。

  • voc(xml)格式 :XML格式因其良好的可读性和扩展性,在目标检测领域得到了广泛应用。它不仅能够存储目标的边界框信息,还能包含其他元数据信息,如图像来源、拍摄时间等。
  • coco(json)格式:JSON格式以其轻量级和易于解析的特点,成为许多现代目标检测数据集的首选。它支持多层嵌套结构,能够更灵活地表示复杂的目标关系。
  • yolo(txt)格式:YOLO算法专用的txt格式标签,简洁明了,直接包含目标的类别和边界框坐标。这种格式在YOLO系列算法的训练中非常高效。

因为我以后的项目大概率继续用的是txt格式,所以本文只写txt格式的相关内容,其他格式参考上面的两个链接。

1、yolo的txt格式

yolov5的比较简单,就是图片和标签分别两个文件夹中,并且自己分类,将图片与标签按照一定的比例区分成训练集和验证集。

txt的标签如下图所示:

第一列为目标类别,后面四个数字为**x_center, y_center, w, h**,可以看到都是小于1的数字,是因为对应的整张图片的比例,所以就算图像被拉伸放缩,这种txt格式的标签也可以找到相应的目标。

使用makesense.ai(上一篇文章说过的一个超级强大的在线标注工具)标注之后直接输出的就是txt标签文件,分一下文件夹即可训练。

2、划分数据集

代码请教GPT

3、修改代码

自己的数据集标注好,分好之后当然是用模型进行训练啦。

1、custom.yaml文件

仿照./data/文件夹下的yaml文件,自己写一个

这边的"path" 和"names"改成自己的,这里笔者的train_data放在和yolov5相同目录下。

然后按照官方用例跑,data 参数改为自己的custom.yaml:

复制代码
python train.py --data custom.yaml --epochs 300 --weights ./weights/yolov5s.pt --cfg yolov5s.yaml  --batch-size 128
相关推荐
隔窗听雨眠2 分钟前
原生一体化多模态大模型技术研究:从拼接到统一的架构革命
人工智能·架构
羊羊小栈12 分钟前
Uplift营销供应链协同决策系统(基于Uplift因果推断与运筹优化算法)
前端·人工智能·算法·毕业设计·大作业
苏州邦恩精密16 分钟前
江苏三维扫描仪厂家如何选择合适的工业测量方案?
人工智能·科技·机器学习·3d·自动化·制造
humors22116 分钟前
100种社会实践
人工智能·程序人生
保卫大狮兄21 分钟前
什么是WBS项目管理?WBS有哪些核心功能?
大数据·人工智能
标书畅畅行22 分钟前
钛投标:全流程企业级AI标书解决方案,重构投标数字化生产力
大数据·人工智能
叫我:松哥30 分钟前
基于深度卷积神经网络的水果图片分类算法设计与实现,有ResNet50的迁移学习模型,准确率达95%
人工智能·python·神经网络·机器学习·分类·cnn·迁移学习
大囚长30 分钟前
大模型API的上下文缓存(Contextual Cache)
人工智能·缓存
无心水31 分钟前
【Hermes:团队、企业、生态与边界】47、Hermes 在 CI/CD 中的完整 DevOps 流水线:从 PR 审查到自动部署,让 Agent 接管你的发布流程
运维·人工智能·devops·openclaw·养龙虾·hermes·honcho
名不经传的养虾人35 分钟前
从0到1:企业级AI项目迭代日记 Vol.44|功能建好,和功能接通,是两件完全不同的事
人工智能·架构·agent·ai编程·企业ai