这是一种用于细粒度图像分类的新的大规模零售产品数据集。与以往专注于相对较少产品的数据集不同,我们收集了2000多种不同零售产品的35万张图像,这些图像直接在真实的零售商店的货架上拍摄。我们的数据集旨在推进零售对象识别的研究,该研究具有大量应用,如自动货架审计和基于图像的产品信息检索。我们的实验表明,即使是最先进的细粒度分类方法也没有优于简单的ResNet基线,这表明在细粒度零售产品分类任务上,提高分类性能的研究还有很大的潜在空间。我们的数据集具有以下特性:(1)就产品类别而言,它是迄今为止最大的数据集。(2)所有图像都是在自然照明的实体零售店中手动拍摄的,符合真实的应用场景。 (3)我们为每个对象提供丰富的注释,包括大小,形状和口味/气味。我们相信我们的数据集可以使计算机视觉研究和零售业受益。
数据集的示例图像:
RP2K的数据收集渠道:
不同元分类的样本图像:((top)按产品类型分类;(底部)按产品形状分类)
带有属性信息的示例:
数据下载 : RP2K链接 -- 品览科技https://www.pinlandata.com/rp2k_dataset
下载文件示例: