yolo 还真不怕你把照片拍的很大,它有办法自动处理这些事情,但是我们在采集图片时,还是尽量确保所有的图片大小差不多,这样也方便打标签。
打标签工具:labelimg (工具和数据集相见网盘:链接: https://pan.baidu.com/s/1QbPyoGq3_yOpWYvorxyPeg?pwd=8vmg 提取码: 8vmg)
也可以使用pip install labelimg 安装,但windows 用户建议还是使用现成的 labelimg.exe,实测发现 pip 安装的易出现闪退,非常影响效率和心情。
(python特产,包兼容性问题)
要根治,最好是下载python 源码,安装源码指定的依赖版本

labeimg 操作详见:https://zhuanlan.zhihu.com/p/550021453
打标签前,建议把所有的图片放在一个目录下(对,可以混放),但是要避免文件名冲突。
解决第一个问题,文件名冲突。
问题场景,我有两个目录,这两个目录里面都是图片,但是图片的文件名有部分冲突,我想放到一起,怎么办。
(来无中生有)


(图片生成完毕)



总结:把你想做的事情,尽量描述清楚,剩下的交给 traeCN
接下来,你可以开始打标签了。
打好标签后,在原有图片目录基础上,你会得到一个标签目录,标签目录内的文件名,和图片目录完全一致。

接下来:
"我有一个图片目录 imgClass,一个标签目录 labels,我要按照 yolov8 的目录格式将图片集重新组织,如图所示。你给我写个代码,将图片输出到 target 目录,还要产生一个符合 yolov8 的 data.yaml文件。训练集、验证集、测试集的分割比例为 8:1:1,分割前,你要打乱图片的顺序,确保图片足够分散。"

traeCN 的操作如下图(使用微信、QQ 等工具截好图,直接粘贴就行,它支持图片内容识别):

很快搞定

接下来微调一下即可:
真实的 data.yaml 长这样:

如果你有多个分类,要按上面的格式,注意标签txt 文件里面,0 对应的是第一个标签

这个"0" 实际上是 'five'
(yolov8 格式数据集示例详见网盘,可以直接使用:链接: https://pan.baidu.com/s/1QbPyoGq3_yOpWYvorxyPeg?pwd=8vmg 提取码: 8vmg)
最后,训练模型。



训练开始前,确认你已经配置好了环境。
AI学习环境配置合集
https://blog.csdn.net/razelan/article/details/152720013?spm=1001.2014.3001.5502

注意:如果你有 n 卡,这里要改一下:

注意:在 python 3.10.x 版本 yolo 最多安装到 yolov11(对应ultralytics 8.3.0)。如果你用的是英伟达 50 系列显卡,要安装 torch2.8.0 cuda 以上版本。
在此之前,记得: pip 更换清华源
最后:出 bug 了怎么办?
先选中出错内容:

点击"添加到对话"

traeCN 很强大,它可以解决的问题不限于 traeCN 以内,甚至可以解决一些系统上的问题,灵活运用能让你事半功倍。
甚至,你可以给它提问,让它回答,而不是写代码。




最后,这玩意免费的。