在mmdet 3.0系列中使用visualizer进行目标检测真实框和检测框的可视化和绘制 并保存为图像

在 MMDetection 3.0 中,使用 visualizer 进行目标检测的真实框和检测框的可视化和绘制,并将结果保存为图像,是一个比较简便且高效的方法。以下是具体的实现步骤和代码示例。

步骤

加载必要的库和初始化模型。

加载测试图像和数据集。

进行推理。

使用 visualizer 绘制真实框和检测框。

保存绘制结果。

示例代码

首先,确保你的环境中安装了最新版本的 MMDetection。

bash 复制代码
pip install mmdet==3.0.0
pip install -U openmim
mim install mmdet

以下是一个完整的代码示例:

python 复制代码
import mmcv
import cv2
import numpy as np
import matplotlib.pyplot as plt
from mmdet.apis import init_detector, inference_detector
from mmdet.utils import register_all_modules
from mmdet.visualization import DetLocalVisualizer
from mmdet.datasets import build_dataset
from mmdet.datasets.pipelines import Compose

# 注册所有模块
register_all_modules()

# 配置文件和模型检查点的路径
config_file = 'path/to/your/config/file.py'
checkpoint_file = 'path/to/your/checkpoint/file.pth'

# 初始化模型
model = init_detector(config_file, checkpoint_file, device='cuda:0')

# 测试图像路径
img = 'path/to/your/test/image.jpg'

# 构建数据集
cfg = mmcv.Config.fromfile(config_file)
dataset = build_dataset(cfg.data.test)

# 获取样本数据
data = dataset[0]

# 提取图像和 ground truth boxes
img_path = data['img_metas'][0].data['filename']
gt_bboxes = data['gt_bboxes'][0].data.numpy()
gt_labels = data['gt_labels'][0].data.numpy()

# 加载图像
img = mmcv.imread(img_path)

# 绘制 ground truth boxes
visualizer = DetLocalVisualizer()
visualizer.dataset_meta = dataset.metainfo

# 创建 ground truth 数据
gt_data = {
    'bboxes': gt_bboxes,
    'labels': gt_labels
}

# 绘制 ground truth boxes
visualizer.add_datasample('ground_truth', img, gt_data, draw_gt=True)

# 推理检测
result = inference_detector(model, img)

# 绘制检测框
visualizer.add_datasample('detection', img, result, draw_pred=True, show=True)

# 保存结果图像
out_file = 'path/to/save/result_image.jpg'
visualizer.add_datasample('detection', img, result, draw_pred=True, show=False, out_file=out_file)
相关推荐
mit6.82421 小时前
[Sora] 从检查点恢复训练 | `Booster`接口 | EMA模型 | .safetensors
人工智能·算法·机器学习
jixunwulian21 小时前
5G+AIoT智赋,AI电力加密边缘网关智慧电网数字化运维解决方案
运维·人工智能·5g
CoovallyAIHub21 小时前
清华Mars Lab发布SLAM-Former:用一个Transformer统一SLAM的前端与后端(附项目地址)
深度学习·算法·计算机视觉
suke21 小时前
RAG 已死,Agent 永生:理解 AI 检索的范式革命
人工智能·程序员·aigc
cooldream200921 小时前
大模型分类与应用全景解析:从文本到多模态的智能演进
人工智能·ai·大模型基础
ECT-OS-JiuHuaShan21 小时前
哥德尔不完备定理中的完备是什么?是还原论证的具足幻想。不还原就是完备,哥德尔搞不完定理
人工智能·数学建模·学习方法·几何学·量子计算·拓扑学·空间计算
i.ajls21 小时前
强化学习入门-3(AC)
人工智能·深度学习·机器学习·actor-critic
Blossom.11821 小时前
把AI“浓缩”到1KB:超紧凑型决策树在MCU上的极限优化实战
人工智能·python·单片机·深度学习·决策树·机器学习·数据挖掘
CoovallyAIHub21 小时前
AI基础设施新玩家:Tinker如何重新定义LLM微调工作流?
深度学习·算法·计算机视觉
努力努力再nuli1 天前
学习华为昇腾AI教材图像处理原理与应用部分Day1
图像处理·人工智能·学习