学习python使用Ultralytics的YOLO26进行旋转框检测的基本用法

gc_22992026-04-20 10:04

Ultralytics的YOLO26模型提供专门的旋转框检测模型以支持旋转边界框检测，其主要预训练模型及参数如下表所示，其中的mAP^test50-95(e2e)指标指IoU从0.5到0.95多个阈值下的平均精度，用于评估评估模型在高难度、高精度需求下的性能，而mAP^test50(e2e)指标指在IoU=0.5单一阈值下的平均精度，用于快速对比基线模型，或对定位精度要求不高的任务。

定向目标检测器的输出是一组旋转的边界框，这些边界框精确地包围了图像中的目标，以及每个框的类别标签和置信度分数。当目标以各种角度出现时，定向边界框特别有用，例如在航空图像中，传统的轴对齐边界框可能包含不必要的背景。
YOLO26的旋转框检测模型的输出数据形状为 $N,7$ （检测）或 $N,8$ （追踪），也即result.obb. data的数据形状，其中N为从图片中检测到的目标个数，第二个维度则是目标的位置及置信度信息。

模型检测结果中的obb.xywhr属性保存检测到所有目标的边界框及旋转角度，obb.xyxyxyxy属性的数据形状为 $N,4,2$ ，保存所有目标的边界框四个角的坐标。不过将旋转框检测模型转换为onnx格式后，其输出形状变为 $1,300,7$ ，具体解析方式后续再学习。

YOLO26的旋转框检测模型是在DOTAv1数据集上进行的预训练，分类只有14种，其使用示例、运行效果（测试图片来自百度图片）、数据形式如下所示：

python 复制代码

from ultralytics import YOLO

# Load a model
model = YOLO(r"E:\MyPrograms\Python\ultralytics\yolo26m-obb.pt")

# Predict with the model
results = model("ship.jpg")

# Access the results
for result in results:
    print(result.obb.data)
    print(result.obb.xywhr)
    print(result.obb.xyxyxyxy)
    print(result.names)
    result.show()

参考文献：

$1$ https://docs.ultralytics.com/zh/models/yolo26/

$2$ https://docs.ultralytics.com/zh/tasks/obb/

$3$ https://deepwiki.com/ultralytics/ultralytics/5.2-annotation-and-plotting-utilities#obb

$4$ https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/DOTAv1.yaml