plt函数显示图片 & 在图片上画边界框 & 边界框坐标转换

一.读取图片并显示图片

python 复制代码
%matplotlib inline
import torch
from d2l import torch as d2l
python 复制代码
'''读取图片'''
image_path = '../data/images/cat_dog_new.jpg'
# 创建画板
figure = d2l.set_figsize()
image = d2l.plt.imread(image_path)
d2l.plt.imshow(image);

二.给出一个(x左上角,y左上角,x右下角,y右下角)类型的框,在图片上画出该框

python 复制代码
'''边界框'''
box = (60,50,460,510)
python 复制代码
def bbox_to_rect(bbox, color):
    # 将边界框(左上x,左上y,右下x,右下y)格式转换成matplotlib格式:
    # ((左上x,左上y),宽,高)
    return d2l.plt.Rectangle(
        xy=(bbox[0], bbox[1]), width=bbox[2]-bbox[0], height=bbox[3]-bbox[1],
        fill=False, edgecolor=color, linewidth=2)
python 复制代码
# 返回一个画布,该画布上面有图画image
fig = d2l.plt.imshow(image)
# 在该画布上画一个矩形框
fig.axes.add_patch(bbox_to_rect(box,'red'));

三. 边界框坐标转换

3.1 左上角右下角格式的坐标 --> 边界框中心坐标,框的高和宽

原:(x1,y1,x2,y2)

w = x2-x1

h = y2-y1

中心坐标 = (x1+w/2,y1+h/2)

python 复制代码
def box_corner_to_center(boxes):
    # 因为以后boxes可能不止一个,所以 boxes[:,0]取出所有行的第一列
    x1,y1,x2,y2 = boxes[:,0],boxes[:,1],boxes[:,2],boxes[:,3]
    w = x2-x1
    h = y2-y1
    x_center,y_center = x1 + w/2, y1 + h/2
    # axis=-1表示在最后一个维度上进行堆叠
    boxes = torch.stack((x_center,y_center,w,h),axis = -1)
    return boxes

创建两个左上角走下角格式的坐标boxes

python 复制代码
dog_bbox, cat_bbox = [60.0, 45.0, 378.0, 516.0], [400.0, 112.0, 655.0, 493.0]
boxes = torch.tensor((dog_bbox,cat_bbox))
print(boxes)
boxes.shape
python 复制代码
tensor([[ 60.,  45., 378., 516.],
        [400., 112., 655., 493.]])

torch.Size([2, 4])

运行结果

python 复制代码
box_corner_to_center(boxes)
python 复制代码
tensor([[219.0000, 280.5000, 471.0000, 318.0000],
        [527.5000, 302.5000, 381.0000, 255.0000]])
torch.Size([2, 4])

3.2 边界框中心坐标,框的高和宽 --> 左上角右下角格式的坐标

原:(x_center,y_center,w,h)

x1 = x_center - 0.5w
y1 = y_center - 0.5
h

x2 = x_center + 0.5w
y2 = y_center + 0.5
h

python 复制代码
def box_center_to_corner(boxes):
    x_center,y_center,w,h = boxes[:,0],boxes[:,1],boxes[:,2],boxes[:,3]
    x1,y1= x_center-0.5*w , y_center-0.5*h
    x2,y2= x_center+0.5*w , y_center+0.5*h
    boxes = torch.stack((x1,y1,x2,y2),axis=-1)
    return boxes
python 复制代码
boxes = box_center_to_corner(boxes)
print(boxes)
boxes.shape
python 复制代码
tensor([[ 60.,  45., 378., 516.],
        [400., 112., 655., 493.]])

torch.Size([2, 4])
相关推荐
fpcc3 分钟前
AI和大模型——Fine-tuning
人工智能·深度学习
爱问的艾文11 分钟前
八周带你手搓AI应用-Day4-赋予你的AI“记忆力”
人工智能
ACP广源盛1392462567323 分钟前
IX8024与科学大模型的碰撞@ACP#筑牢科研 AI 算力高速枢纽分享
运维·服务器·网络·数据库·人工智能·嵌入式硬件·电脑
向量引擎32 分钟前
向量引擎接入 GPT Image 2 和 deepseek v4:一个 api key 把热门模型串起来,开发者终于不用深夜修接口了
人工智能·gpt·计算机视觉·aigc·api·ai编程·key
努力努力再努力FFF44 分钟前
医生对AI辅助诊断感兴趣,作为临床人员该怎么了解和学习?
人工智能·学习
AI医影跨模态组学1 小时前
如何将纵向MRI深度学习特征与局部晚期直肠癌新辅助放化疗后的免疫微环境建立关联,并解释其对pCR及预后的机制
人工智能·深度学习·论文·医学·医学影像·影像组学
Empty-Filled1 小时前
AI生成测试用例功能怎么测:一个完整实战案例
网络·人工智能·测试用例
eastyuxiao1 小时前
设计一个基于 OpenClaw 的 AI 智能体来辅助交易
人工智能
波动几何1 小时前
因果动力学架构技能cda
人工智能
Lucas_coding2 小时前
【Claude Code Router】 Claude Code 兼容 OpenAI 格式 API, Claude code 接入本地部署模型
人工智能·python