数据集

深度学习lover

＜数据集＞yolo 小麦麦穗识别＜目标检测＞数据集下载链接 https://download.csdn.net/download/qq_53332949/93180205数据集格式：VOC+YOLO格式

前网易架构师-高司机

带标注的扑克牌识别数据集，识别率99.5%，3083张图，支持yolo，coco json，voc xml,文末有模型训练代码本数据集专为扑克牌识别任务设计，包含3083张高质量扑克牌图像，在YOLO系列模型上实现了高达99.5%的识别准确率。数据集支持多种主流标注格式，包括YOLO格式、COCO JSON和PASCAL VOC XML，满足不同深度学习框架的需求。文末提供了完整的模型训练和验证代码，方便研究人员和开发者快速上手。

前网易架构师-高司机

带标注的浮游藻类24种数据集，识别率91.5 %数据集， 23175张图，支持yolo，coco json，voc xml,文末有模型训练代码本文介绍一个高质量的浮游藻类图像数据集，包含24种常见藻类，共计23,175张标注图像。该数据集在目标检测任务中达到了91.5%的识别率，支持YOLO系列（v7-v12、v26）、COCO JSON和Pascal VOC XML等多种标注格式。文末提供了完整的模型训练代码，方便研究者快速上手。

前网易架构师-高司机

带标注的成熟棉花识别数据集，识别率83.9%数据集，505张图，支持yolo，coco json，voc xml,文末有模型训练代码这是一个高质量的成熟棉花识别数据集，包含1505张带标注的图像，在测试中达到了83.9%的识别率。数据集支持YOLO系列模型（包括YOLOv7/v8/v9/v11/v12/v26）、COCO JSON和PASCAL VOC XML格式，文末还提供了完整的模型训练代码。

微调数据集（主流开源模型）本文系统梳理模型微调（SFT & 偏好对齐）领域的核心数据格式，从 ShareGPT、Alpaca 到 ChatML、DPO，涵盖格式设计哲学、最小化案例、推荐测试数据集，并深入讲解如何脱离高级框架，基于原生 Hugging Face API 手动准备“裸数据”。最后针对 Llama、Qwen、Mistral 等主流模型给出适配要点，并提供企业级落地的商业建议。

前网易架构师-高司机

带标注的移动通信基站信号塔，可识别塔架和塔身数据集，识别率93.5%，1008张图，支持yolo，coco json，voc xml,文末有模型训练代码本文介绍一个带标注的移动通信基站信号塔数据集，可用于识别塔架和塔身结构。该数据集包含1008张图像，识别率达到93.5%，支持YOLO系列模型（包括YOLOv7-v12）、COCO JSON和PASCAL VOC XML格式。文末提供了完整的模型训练代码。

ShareGPT 数据集格式ShareGPT 格式是一种对话式微调数据的通用结构，核心思想是将多轮人机对话组织为 conversations 列表，每个条目代表一轮发言，明确标注发言者角色（from）和内容（value）。

皓悦编程记

【免费数据集010期】Grape Leaf Diseases 葡萄叶病害检测数据集（4类）：面向智慧农业的叶片病害识别基准Grape Leaf Diseases数据集是一个专注于葡萄叶片病害检测的专业计算机视觉数据集，专为智慧农业领域的病害自动识别任务构建。该数据集针对葡萄种植中常见的叶片病害问题，收集了真实种植场景下的叶片图像并完成专业标注，为病害检测算法的训练与评估提供了可靠基准。

字节跳动开源

EdgeBench：衡量真实世界环境学习，发现新 Scaling Law过去几年，预训练 Scaling Law 让人们逐渐形成了一种共识：模型能力会随着数据量和算力的增加，以相对可预测的方式持续提升。但当大模型真正进入真实世界之后，一个更贴近应用的问题开始出现：它还能不能在与环境的持续交互中继续学习，并不断变强？

前网易架构师-高司机

带标注的带标注的医用采血管分类和标签识别数据集，识别率80.7%，5524张图，支持yolo，coco json，voc xml,文末有模型训练代码本数据集包含5524张带标注的医用采血管图像，涵盖6个关键类别，识别准确率达80.7%。数据集支持YOLO系列（v7-v12）、COCO JSON和PASCAL VOC XML格式，适用于医疗图像识别、自动化分拣系统开发等场景。文末提供完整的YOLO模型训练代码。

HyperAI超神经

数据集汇总丨英伟达开源Nemotron系列数据集，超10T tokens+40M 条后训练样本，覆盖数学推理/代码生成/多语言对话训练数据正在成为大模型竞争的关键变量。当参数量不再是唯一壁垒，数据的质量、结构与任务适配性，开始决定模型在推理、代码、交互等维度上的真实表现。

前网易架构师-高司机

带标注的山体滑坡塌方数据集数据集，识别率78.1%，974张图，支持yolo，coco json，voc xml,文末有模型训练代码本文介绍一个高质量的山体滑坡与塌方检测数据集。该数据集包含 974 张精心标注的图像，在目标检测任务中达到了 78.1% 的识别率。数据集支持多种主流格式，包括 YOLO、COCO JSON 和 Pascal VOC XML，方便用户直接用于模型训练。文末还提供了完整的模型训练代码。

前网易架构师-高司机

带标注的SDD-SAR遥感船舶识别数据集，识别率92.9%，7000张图，支持yolo，coco json，voc xml,文末有模型训练代码SDD-SAR遥感船舶识别数据集是一个高质量的开源数据集，包含7000张带标注的遥感图像，专门用于船舶目标检测任务。该数据集在测试集上达到了**92.9%**的识别率，支持YOLO系列（v7-v12、v26）、COCO JSON和PASCAL VOC XML等多种标注格式。文末附有完整的模型训练代码，方便快速上手。

程序员正茂

YOLOX训练自己的COCO数据集训练环境说明操作系统：Windows 11 家庭版中文版，25H2CPU：13th Gen Intel(R) Core(TM) i9-13980HX (2.20 GHz)

前网易架构师-高司机

带标注的车轮胎上的螺母识别数据集，识别率87.2%，83张图，支持yolo，coco json，voc xml,darknet文末有模型训练代码本数据集专注于车轮胎上的螺母识别任务，是一个高质量的目标检测数据集。数据集包含83张精心标注的图片，涵盖了不同角度、光照条件和背景下的轮胎螺母图像。经过测试，该数据集训练的模型在螺母识别任务上达到了87.2%的识别率，具有良好的实用价值。

前网易架构师-高司机

带标注的21种中药材识别数据集，识别率73.8%数据集，2237张图，支持yolo，coco json，voc xml,文末有模型训练代码本数据集是一个专门用于中药材识别的计算机视觉数据集，包含21种常见中药材的2237张高质量标注图片。数据集经过精心整理和标注，旨在为中药材识别研究提供标准化的训练和测试资源。可以识别出天麻、白芷、麦冬、甘草、火麻仁、百合、决明子、川芎、莲子心、酸枣仁、陈皮、大枣、黄芪、山楂、当归、玉竹、枸杞子、白茅根、凉粉草、丹参、冬虫夏草等 21 种药材

前网易架构师-高司机

带标注的打电话识别数据集，识别率98.9%，9723张图，支持yolo，coco json，voc xml,文末有模型训练代码本文介绍一个专门用于打电话行为识别的高质量数据集，包含9723张精心标注的图片，在YOLO系列模型上测试识别率可达98.9%。该数据集支持多种主流标注格式，包括YOLO格式、COCO JSON格式和PASCAL VOC XML格式，方便不同框架和场景下的使用。

前网易架构师-高司机

带标注的辣椒病叶数据集，识别率95.9%，可识别三种病害和健康叶子，9916张图，支持yolo，coco json，voc xml,文末有模型训练代码带标注的辣椒病叶数据集，识别率95.9%，可识别三种病害和健康叶子，9916张图，支持yolo，coco json，voc xml,文末有模型训练代码

社交媒体数据集示例这些社交媒体数据集示例总计包含数千条记录。所有数据集均使用 Bright Data API 提取。以及更多。

前网易架构师-高司机

带标注的土豆马铃薯病叶数据集，识别6种病害和健康叶，识别率93.4%，3718张图，支持yolo，coco json，voc xml,文末有模型训练代码带标注的土豆马铃薯病叶数据集，识别6种病害和健康叶，识别率93.4%，3718张图，支持yolo，coco json，voc xml,文末有模型训练代码