YOLO自制数据集及训练

使用 Make Sense 网站进行标注

python 复制代码
https://www.makesense.ai/

可以让AI帮你先标一下

一定要点一下 + ,不然不会加进去

导出标签



长这个样子

按照你标签的顺序

分别是 car tree tree tree

标签格式

类 x中心 y中心 w h

xy坐标归一化到(0,1)

文件夹格式

布置训练集

在 my_data 文件夹下分别建立 images labels

修改--data (.yaml)

发现coco中没有 tree 类别,故删掉 ,添加

修改这里

修改成

训练时,报了个错

UnicodeDecodeError: 'gbk' codec can't decode byte 0xb7 in position 318: illegal multibyte sequence

原因:.yaml 文件里不能有中文标注,去掉就好嘞了。
其他问题,先按照上一篇文章的修改错误部分进行修改,之后就可以运行了

SPPF

python 复制代码
https://blog.csdn.net/Steven_Cary/article/details/120886696

RuntimeError: Given groups=1, weight of size [512, 1024, 1, 1], expected input[1, 512, 8, 8] to have 1024 channels, but got 512 channels instead

python 复制代码
https://blog.csdn.net/qq_43533724/article/details/121743384

RuntimeError: result type Float can't be cast to the desired output type long int

python 复制代码
https://blog.csdn.net/abdddwxh/article/details/127509089

本地 GPU 对自制数据集训练完成

6张图片,4个类别,训练了5.28分钟(300轮epochs)

使用训练好的模型进行检测

对这里进行修改

改成权重的相对路径

会对这个目录下的所有图片进行预测,这里先改成训练集的位置

自己打的标签

预测的结果







相关推荐
zone773911 分钟前
004:RAG 入门-LangChain读取PDF
后端·python·面试
zone773916 分钟前
005:RAG 入门-LangChain读取表格数据
后端·python·agent
jerrywus39 分钟前
为什么每个程序员都应该试试 cmux:AI 加持的终端效率革命
前端·人工智能·claude
孟祥_成都1 小时前
AI 术语满天飞?90% 的人只懂名词,不懂为什么!
前端·人工智能
机器之心1 小时前
高德纳:「震惊!震惊!」Claude破解《计算机程序设计艺术》难题
人工智能·openai
石臻臻的杂货铺1 小时前
GPT-5.4 发布:Computer Use 超越人类,Tool Search 让 Agent 用工具省了一半 token
人工智能
gustt1 小时前
使用 LangChain 构建 AI 代理:自动化创建 React TodoList 应用
人工智能·llm·agent
碳基沙盒1 小时前
OpenClaw 浏览器自动化配置完全指南
人工智能
Baihai_IDP2 小时前
在 Anthropic 的这两年,我学会了 13 件事
人工智能·程序员·llm
IT_陈寒2 小时前
JavaScript这5个隐藏技巧,90%的开发者都不知道!
前端·人工智能·后端