目标检测图像letterbox、坐标变换处理脚本

import os

import shutil

from tqdm import tqdm

import cv2

def my_letter_box(img,size=(320,320)): #

h,w,c = img.shape

r = min(size[0]/h,size[1]/w)

new_h,new_w = int(h*r),int(w*r)

top = int((size[0]-new_h)/2)

left = int((size[1]-new_w)/2)

bottom = size[0]-new_h-top

right = size[1]-new_w-left

img_resize = cv2.resize(img,(new_w,new_h))

img = cv2.copyMakeBorder(img_resize,top,bottom,left,right,borderType=cv2.BORDER_CONSTANT,value=(114,114,114))

return img,r,left,top

SRC_DIR = r"/data/detect/2/"

DST_DIR_IMG = r"/data/detect/images320/"

DST_DIR_LABELS = r"/data/detect/labels320/"

imglist = os.listdir(SRC_DIR)

for file in tqdm(imglist):

if not file.endswith(".jpg"):

continue

name = file.split(".jpg")[0]

if not os.path.exists(SRC_DIR+name+".txt"):

continue

#shutil.copy(SRC_DIR+file,DST_DIR_IMG+file)

img =cv2.imread(SRC_DIR+file)

h_img,w_img,c= img.shape

img_letter,rr,left,top= my_letter_box(img)

cv2.imwrite(DST_DIR_IMG+file,img_letter)

with open(os.path.join(SRC_DIR, name+".txt"), 'r', encoding="utf-8") as r:

label_list = r.readlines()

with open(os.path.join(DST_DIR_LABELS, name+".txt"), 'a+') as ftxt:

for label in label_list:

label1 = [x for x in label.split(" ") if x != ""]

class_name =label1[0]

x = float(label1[1])

y = float(label1[2])

w = float(label1[3])

h = float(label1[4])

ww = w_img*w

hh = h_img*h

xx1 = (x-w/2)*w_img

yy1 = (y-h/2)*h_img

xx2 = ww+xx1

yy2 = hh+yy1

x_letter_1 = (xx1)*rr+left

y_letter_1 = (yy1)*rr+top

x_letter_2 = (xx2)*rr+left

y_letter_2 = (yy2)*rr+top

#print("x=",x)

#print("h=",h)

#ftxt.writelines(class_name + " " + str(xx1) + " " + str(yy1)+" " + str(xx2) + " "+str(yy2) + '\n')

ftxt.writelines(class_name + " " + str(x_letter_1) + " " + str(y_letter_1)+" " + str(x_letter_2) + " "+str(y_letter_2) + '\n')

ftxt.close()

相关推荐
数新网络3 小时前
The Life of a Read/Write Query for Apache Iceberg Tables
人工智能·apache·知识图谱
Yangy_Jiaojiao3 小时前
开源视觉-语言-动作(VLA)机器人项目全景图(截至 2025 年)
人工智能·机器人
gorgeous(๑>؂<๑)3 小时前
【ICLR26匿名投稿】OneTrackerV2:统一多模态目标跟踪的“通才”模型
人工智能·机器学习·计算机视觉·目标跟踪
坠星不坠4 小时前
pycharm如何导入ai大语言模型的api-key
人工智能·语言模型·自然语言处理
周杰伦_Jay4 小时前
【智能体(Agent)技术深度解析】从架构到实现细节,核心是实现“感知环境→处理信息→决策行动→影响环境”的闭环
人工智能·机器学习·微服务·架构·golang·数据挖掘
王哈哈^_^4 小时前
【完整源码+数据集】课堂行为数据集,yolo课堂行为检测数据集 2090 张,学生课堂行为识别数据集,目标检测课堂行为识别系统实战教程
人工智能·算法·yolo·目标检测·计算机视觉·视觉检测·毕业设计
Elastic 中国社区官方博客4 小时前
Observability:适用于 PHP 的 OpenTelemetry:EDOT PHP 加入 OpenTelemetry 项目
大数据·开发语言·人工智能·elasticsearch·搜索引擎·全文检索·php
神仙别闹5 小时前
基于 C++和 Python 实现计算机视觉
c++·python·计算机视觉
ytttr8735 小时前
Landweber迭代算法用于一维、二维图像重建
人工智能·算法·机器学习
feifeigo1235 小时前
Matlab编写压缩感知重建算法集
人工智能·算法·matlab