YOLO自制数据集及训练

使用 Make Sense 网站进行标注

python 复制代码
https://www.makesense.ai/

可以让AI帮你先标一下

一定要点一下 + ,不然不会加进去

导出标签



长这个样子

按照你标签的顺序

分别是 car tree tree tree

标签格式

类 x中心 y中心 w h

xy坐标归一化到(0,1)

文件夹格式

布置训练集

在 my_data 文件夹下分别建立 images labels

修改--data (.yaml)

发现coco中没有 tree 类别,故删掉 ,添加

修改这里

修改成

训练时,报了个错

UnicodeDecodeError: 'gbk' codec can't decode byte 0xb7 in position 318: illegal multibyte sequence

原因:.yaml 文件里不能有中文标注,去掉就好嘞了。
其他问题,先按照上一篇文章的修改错误部分进行修改,之后就可以运行了

SPPF

python 复制代码
https://blog.csdn.net/Steven_Cary/article/details/120886696

RuntimeError: Given groups=1, weight of size [512, 1024, 1, 1], expected input[1, 512, 8, 8] to have 1024 channels, but got 512 channels instead

python 复制代码
https://blog.csdn.net/qq_43533724/article/details/121743384

RuntimeError: result type Float can't be cast to the desired output type long int

python 复制代码
https://blog.csdn.net/abdddwxh/article/details/127509089

本地 GPU 对自制数据集训练完成

6张图片,4个类别,训练了5.28分钟(300轮epochs)

使用训练好的模型进行检测

对这里进行修改

改成权重的相对路径

会对这个目录下的所有图片进行预测,这里先改成训练集的位置

自己打的标签

预测的结果







相关推荐
CV@CV2 分钟前
拆解自动驾驶核心架构——感知、决策、控制三层逻辑详解
人工智能·机器学习·自动驾驶
专注VB编程开发20年2 分钟前
python图片验证码识别selenium爬虫--超级鹰实现自动登录,滑块,点击
数据库·python·mysql
海心焱6 分钟前
从零开始构建 AI 插件生态:深挖 MCP 如何打破 LLM 与本地数据的连接壁垒
jvm·人工智能·oracle
阿杰学AI7 分钟前
AI核心知识85——大语言模型之 RLAIF(简洁且通俗易懂版)
人工智能·深度学习·ai·语言模型·aigc·rlaihf·基于ai反馈的强化学习
Coco恺撒7 分钟前
【脑机接口】难在哪里,【人工智能】如何破局(2.研发篇)
人工智能·深度学习·开源·人机交互·脑机接口
iFeng的小屋10 分钟前
【2026最新当当网爬虫分享】用Python爬取千本日本相关图书,自动分析价格分布!
开发语言·爬虫·python
民乐团扒谱机12 分钟前
【微科普】3D 演奏蠕虫分析图:解码音乐表演情感的 “可视化语言”
python·可视化·音乐·3d图·3d蠕虫
kebijuelun13 分钟前
ERNIE 5.0:统一自回归多模态与弹性训练
人工智能·算法·语言模型·transformer
Network_Engineer15 分钟前
从零手写LSTM:从门控原理到PyTorch源码级实现
人工智能·pytorch·lstm
芝士爱知识a18 分钟前
AlphaGBM 深度解析:下一代基于 AI 与蒙特卡洛的智能期权分析平台
数据结构·人工智能·python·股票·alphagbm·ai 驱动的智能期权分析·期权