目标检测开源数据集——COCO数据集

COCO数据集是一个大型的、丰富的物体检测、分割和字幕数据集,全称为Microsoft Common Objects in Context (MS COCO)。该数据集以场景理解为目标,主要从复杂的日常场景中截取,图像中的目标通过精确的segmentation进行位置的标定。这个数据集提供了80个类别,包括行人、汽车、大象等,以及91种材料类别,如草、墙、天空等。整个数据集中个体的数目超过150万个,有超过33万张图片,其中22万张有标注。

COCO数据集的第一个版本于2014年发布,包含16.4万张图像,分为训练集(8.3万张)、验证集(4.1万张)和测试集(4.1万张)。2015年发布了额外的8.1万张图像测试集,包括所有以前的测试图像和4万张新图像。2017年将训练集/验证集分配从8.3万/4.1万更改为11.8万/0.5万张,新的拆分使用相同的图像和标注。2017年测试集是2015年测试集的子集包含4.1万张。此外,2017版本包含一个新的未标注的12.3万张数据集。

COCO数据集不仅适用于物体检测任务,还可以用于语义分割和图像标题生成等任务。由于其大规模和多样性,COCO数据集已成为目标检测领域的基准数据集之一,许多算法都在此数据集上进行了评估和比较。

COCO数据集的每个图像都包含五句图像的语句描述,这些描述由人工编写,并用于评估图像标题生成算法的性能。此外,COCO数据集还提供了关键点检测和字幕生成等任务的标注信息。总的来说,COCO数据集是一个非常丰富和多样的目标检测数据集,它为研究者提供了大量的标注信息,以帮助他们开发和评估新的目标检测算法。这个数据集将继续在目标检测领域发挥重要作用,推动相关技术的不断发展和进步。

地址:数据集地址

链接:https://mp.weixin.qq.com/s?__biz=MzU3NTYxNDA4Ng==\&mid=2247483721\&idx=1\&sn=99bf68b640d54451d364bc5eb5676b57\&chksm=fd213ca0ca56b5b63ce9cf84ab937eb2d6725e2e52f86835bcbbede58fc11786fdb5bc9af07d#rd

关注公众号,每天分享开源数据集

相关推荐
躺柒36 分钟前
读大语言模型08计算基础设施
人工智能·ai·语言模型·自然语言处理·大语言模型·大语言
神州问学38 分钟前
Skywork:昆仑万维推出天工超级智能体
人工智能
神州问学41 分钟前
Graph-RAG全面综述:如何用知识图谱+大模型解决信息检索难题?
人工智能
金井PRATHAMA1 小时前
破译心智密码:神经科学如何为下一代自然语言处理绘制语义理解的蓝图
人工智能·自然语言处理
hllqkbb1 小时前
实战Kaggle比赛:狗的品种识别(ImageNet Dogs)
人工智能
打不过快跑1 小时前
YOLO 入门实战(二):用自定义数据训练你的第一个检测模型
人工智能·后端·python
lingling0091 小时前
艾利特石油管道巡检机器人:工业安全的智能守护者
大数据·网络·人工智能
居然JuRan1 小时前
全网最全的大模型分词器(Tokenizer)总结
人工智能
聚客AI1 小时前
💡突破RAG性能瓶颈:揭秘查询转换与智能路由黑科技
人工智能·langchain·llm
腾讯云开发者1 小时前
架构师夜谈:从历史的视角,看见技术人的财富机遇
人工智能