数据集-草莓成熟度分类数据集-3类草莓未熟(白/绿色)、半熟(粉/浅红色)、完熟(深红色)

数据集-草莓成熟度分类数据集-3类草莓未熟(白/绿色)、半熟(粉/浅红色)、完熟(深红色)

一、数据集概述

在草莓成熟度视觉识别任务中,图像分类是许多智能系统的基础环节,例如传送带分选、单个果实分级、手持设备拍照判定等。然而,当前领域仍面临以下突出痛点:

  • 类别极度不平衡问题普遍存在:在实际农业场景中,半熟草莓的窗口期极短,采集难度大,导致大多数公开数据集呈现"未熟与完熟样本多、半熟样本稀缺"的分布,模型容易忽略半熟类别或将其错误归入相邻类别。
  • 成熟度过渡状态的视觉歧义性:半熟草莓的外观变化极为连续------同一颗草莓在不同光照、不同角度下可能呈现从粉白到浅红的多种表现,不同标注人员对"半熟"边界的认定差异可达30%以上,导致训练数据标注一致性欠佳。
  • 跨场景泛化能力差:许多分类数据集在单一光照、单一品种下采集,模型一旦部署到不同大棚、不同品种或不同季节的草莓上,准确率显著下降。
  • 细粒度分类难度被低估 :草莓未熟(白/绿色)、半熟(粉/浅红色)、完熟(深红色)之间的差异本质上属于细粒度视觉分类,通用分类模型(如ResNet)直接应用容易混淆半熟与完熟的边界,需要针对性设计。

该数据集能够有效解决以下问题:

  • 真实不平衡场景下的分类建模:本数据集还原了农业实际采集中的天然不平衡分布(未熟最多、完熟次之、半熟最少)。
  • 轻量级分类模型部署验证:1,623张图片的规模适中,适合快速训练 YOLO、MobileNet、EfficientNet-Lite、RepVGG 等轻量模型,为边缘设备(如手机、草莓分选机嵌入式系统)提供可行性验证。

二、数据标注图片实例

该数据集通过精心设计的采集和标注流程,方便为研究学习使用。

图像分辨率:224x224 像素

本数据集共包含 1,623 张 草莓果实图像,类别分布如下:

类别 英文标签 图片数量
未熟 unripe 923
半熟 semi-ripe 217
成熟 fully-ripe 483

1. 未熟unripe

果实整体呈白色、浅绿色或青色

2. 半熟semi-ripe

果面出现粉红或浅红色区域,红色占比 30%~70%,仍可见白/绿色区域

3. 成熟fully-ripe

果实整体呈鲜红色或深红色,红色占比 > 90%,表面有光泽

三、标注工具

工具:X-AnyLabeling-CPU.exe

下载地址:https://github.com/CVHub520/X-AnyLabeling/releases

四、数据下载地址

下载地址:https://download.csdn.net/download/qq_21386397/92858670


如果有用,请点个三连呗 点赞、关注、收藏
你的鼓励是我最大的动力

相关推荐
哥布林学者1 小时前
深度学习进阶(十九)相对位置编码 RPE
机器学习·ai
IvanCodes1 小时前
Skills 热潮过去后,我重新理解了 AI Agent 的方向
人工智能·agent
阿维的博客日记1 小时前
什么是TDD for AI,详细讲一下
人工智能·tdd
飞Link1 小时前
从“聊天”到“做事”:2026 年 Agentic AI(代理式人工智能)开发者指南
人工智能
Dshuishui1 小时前
我用 Claude Code 做了一个学术论文搜索工具
开发语言·人工智能·python·pip·uv
IT 行者1 小时前
Spring AI 2.0.0-M5 发布:全面转向 OpenAI Java SDK
java·人工智能·spring
博云技术社区1 小时前
创新智能体 新质生产力——博云发布 BoAgent 智能体平台 以安全可信 Agentic AI 重构企业数字生产力
人工智能
发哥来了1 小时前
六款开源大模型中文长文本处理能力横向评测
大数据·人工智能·机器学习·ai·开源·aigc
fuquxiaoguang1 小时前
SSA架构:国产AI推理的“换道超车“,算力消耗降低1000倍
人工智能·架构·ssa