数据集-草莓成熟度分类数据集-3类草莓未熟(白/绿色)、半熟(粉/浅红色)、完熟(深红色)

数据集-草莓成熟度分类数据集-3类草莓未熟(白/绿色)、半熟(粉/浅红色)、完熟(深红色)

一、数据集概述

在草莓成熟度视觉识别任务中,图像分类是许多智能系统的基础环节,例如传送带分选、单个果实分级、手持设备拍照判定等。然而,当前领域仍面临以下突出痛点:

  • 类别极度不平衡问题普遍存在:在实际农业场景中,半熟草莓的窗口期极短,采集难度大,导致大多数公开数据集呈现"未熟与完熟样本多、半熟样本稀缺"的分布,模型容易忽略半熟类别或将其错误归入相邻类别。
  • 成熟度过渡状态的视觉歧义性:半熟草莓的外观变化极为连续------同一颗草莓在不同光照、不同角度下可能呈现从粉白到浅红的多种表现,不同标注人员对"半熟"边界的认定差异可达30%以上,导致训练数据标注一致性欠佳。
  • 跨场景泛化能力差:许多分类数据集在单一光照、单一品种下采集,模型一旦部署到不同大棚、不同品种或不同季节的草莓上,准确率显著下降。
  • 细粒度分类难度被低估 :草莓未熟(白/绿色)、半熟(粉/浅红色)、完熟(深红色)之间的差异本质上属于细粒度视觉分类,通用分类模型(如ResNet)直接应用容易混淆半熟与完熟的边界,需要针对性设计。

该数据集能够有效解决以下问题:

  • 真实不平衡场景下的分类建模:本数据集还原了农业实际采集中的天然不平衡分布(未熟最多、完熟次之、半熟最少)。
  • 轻量级分类模型部署验证:1,623张图片的规模适中,适合快速训练 YOLO、MobileNet、EfficientNet-Lite、RepVGG 等轻量模型,为边缘设备(如手机、草莓分选机嵌入式系统)提供可行性验证。

二、数据标注图片实例

该数据集通过精心设计的采集和标注流程,方便为研究学习使用。

图像分辨率:224x224 像素

本数据集共包含 1,623 张 草莓果实图像,类别分布如下:

类别 英文标签 图片数量
未熟 unripe 923
半熟 semi-ripe 217
成熟 fully-ripe 483

1. 未熟unripe

果实整体呈白色、浅绿色或青色

2. 半熟semi-ripe

果面出现粉红或浅红色区域,红色占比 30%~70%,仍可见白/绿色区域

3. 成熟fully-ripe

果实整体呈鲜红色或深红色,红色占比 > 90%,表面有光泽

三、标注工具

工具:X-AnyLabeling-CPU.exe

下载地址:https://github.com/CVHub520/X-AnyLabeling/releases

四、数据下载地址

下载地址:https://download.csdn.net/download/qq_21386397/92858670


如果有用,请点个三连呗 点赞、关注、收藏
你的鼓励是我最大的动力

相关推荐
IT_陈寒2 小时前
JavaScript的闭包把我坑惨了,说好的内存会自动回收呢?
前端·人工智能·后端
哥布林学者4 小时前
深度学习进阶(三十一)FlashAttention:IO 感知的精确注意力
机器学习·ai
jooloo6 小时前
Codex 间歇性 400 之谜:一条对话里,它为什么有时候用 chat/completions,有时候切到 responses?
人工智能
用户5191495848456 小时前
OpenSSL PKCS#12 PBMAC1 堆栈缓冲区溢出漏洞 (CVE-2025-11187) 分析与验证
人工智能·aigc
用户5191495848457 小时前
HP Sound Research SECOMNService 权限提升漏洞利用工具
人工智能·aigc
用户018349301697 小时前
给 AI 智能体能力包一层 BFF,前端只调一个接口
人工智能
这token有力气11 小时前
Function Calling 格式漂移
人工智能
onething36511 小时前
Spring Boot + Spring AI 从入门到实战:7天转型计划 Day 5 —— SSE 流式输出 + 打字机效果
人工智能·后端·全栈
onething36511 小时前
Spring Boot + Spring AI 从入门到实战:7天转型计划 Day 6 —— 业务完善 + 会话消息预览
人工智能·后端·全栈
IT_陈寒12 小时前
SpringBoot自动配置的坑,我爬了三天才出来
前端·人工智能·后端