YOLO系列,从V1~V10,持续更新(Pytorch实现)

关于YOLOV1

本文主要偏向代码实战,详细的算法原理着墨不多

主要创新:

实现了实时的目标检测

附上YOLOV1论文地址:
https://arxiv.org/abs/1506.02640
关于数据

首先要了解该网络架构的输入和输出,以及网络是如何进行训练的。这里主要讲一下数据集的格式以及使用labelme制作数据集(当然还有其他更好的工具,这里只做参考)

如果已经安装了python,使用以下命令直接安装labelme工具,没安python的先安python

bash 复制代码
pip install labelme

之后在cmd中输入labelme,然后回车就能看到labelme的前端UI界面了

(ps:在启动labelme时也可以指定很多参数,比如 --flags可以启动时指定有哪些类别,具体不在赘述,感兴趣的读者自行搜索)

bash 复制代码
labelme --flags F:\python\yolo系列\yolov1\flags.txt

之后OpenDir打开图片所在的文件夹路径,然后鼠标右键Create Rectangle夸夸框就完事了,之后会save为json格式的文件。(把自动保存打开的话会保存到图片的路径下如图:随便标了十五张)

如何你有仔细看过YOLOV1的论文会发现json根本不是我们训练所需要的格式,json多了很多无用的信息,甚至Rectangle也只标记了左上和右下两个点。别慌,我们用脚本转化一下:

python 复制代码
import json
import os


def convert(img_size, box):
    x1 = box[0]
    y1 = box[1]
    x2 = box[2]
    y2 = box[3]

    center_x = (x1 + x2) * 0.5 / img_size[0]
    center_y = (y1 + y2) * 0.5 / img_size[1]
    w = abs((x2 - x1)) * 1.0 / img_size[0]
    h = abs((y2 - y1)) * 1.0 / img_size[1]

    return (center_x, center_y, w, h)


def decode_json(jsonfloder_path, json_name):
    txt_name = jsonfloder_path + json_name[0:-5] + '.txt'
    txt_file = open(txt_name, 'w')  # te files

    json_path = os.path.join(json_folder_path, json_name)
    data = json.load(open(json_path, 'r'))

    img_w = data['imageWidth']  # json是一个字典的形式
    img_h = data['imageHeight']
    for i in data['shapes']:

        if (i['shape_type'] == 'rectangle'):

            x1 = int(i['points'][0][0])
            y1 = int(i['points'][0][1])
            x2 = int(i['points'][1][0])
            y2 = int(i['points'][1][1])
            if x1 < 0 or x2 < 0 or y1 < 0 or y2 < 0:
                continue
            else:
                bb = (x1, y1, x2, y2)
                bbox = convert((img_w, img_h), bb)

            ## 这里标签要对其
            if i['label'] == "person":
                 txt_file.write("0 " + " ".join([str(a) for a in bbox]) + '\n')
            elif i['label'] == "plane":
                 txt_file.write("1 " + " ".join([str(a) for a in bbox]) + '\n')
            elif i['label'] == "dog":
                 txt_file.write("2 " + " ".join([str(a) for a in bbox]) + '\n')
            elif i['label'] == "cat":
                 txt_file.write("3 " + " ".join([str(a) for a in bbox]) + '\n')
            elif i['label'] == "car":
                 txt_file.write("4 " + " ".join([str(a) for a in bbox]) + '\n')
            elif i['label'] == "horse":
                 txt_file.write("5 " + " ".join([str(a) for a in bbox]) + '\n')
            elif i['label'] == "can":
                 txt_file.write("6 " + " ".join([str(a) for a in bbox]) + '\n')
            elif i['label'] == "train":
                 txt_file.write("7 " + " ".join([str(a) for a in bbox]) + '\n')


if __name__ == "__main__":

    json_folder_path = r'F:\python\yolo系列\yolov1\images'        # json的path
    json_names = os.listdir(json_folder_path)  # file name
    for json_name in json_names:  # output all files
        print(json_name)
        if json_name[-5:] == '.json':  # just work for json files
            decode_json(json_folder_path, json_name)

不出意外的话会得到如下图所示的txt标签,这才是训练模型所需要的格式

相关推荐
冰西瓜6003 小时前
从项目入手机器学习——鸢尾花分类
人工智能·机器学习·分类·数据挖掘
爱思德学术3 小时前
中国计算机学会(CCF)推荐学术会议-C(人工智能):IJCNN 2026
人工智能·神经网络·机器学习
偶信科技3 小时前
国产极细拖曳线列阵:16mm“水下之耳”如何撬动智慧海洋新蓝海?
人工智能·科技·偶信科技·海洋设备·极细拖曳线列阵
Java后端的Ai之路4 小时前
【神经网络基础】-神经网络学习全过程(大白话版)
人工智能·深度学习·神经网络·学习
庚昀◟4 小时前
用AI来“造AI”!Nexent部署本地智能体的沉浸式体验
人工智能·ai·nlp·持续部署
喜欢吃豆4 小时前
OpenAI Realtime API 深度技术架构与实现指南——如何实现AI实时通话
人工智能·语言模型·架构·大模型
数据分析能量站4 小时前
AI如何重塑个人生产力、组织架构和经济模式
人工智能
wscats5 小时前
Markdown 编辑器技术调研
前端·人工智能·markdown
AI科技星5 小时前
张祥前统一场论宇宙大统一方程的求导验证
服务器·人工智能·科技·线性代数·算法·生活
GIS数据转换器5 小时前
基于知识图谱的个性化旅游规划平台
人工智能·3d·无人机·知识图谱·旅游