Ultralytics的YOLO26模型提供专门的旋转框检测模型以支持旋转边界框检测,其主要预训练模型及参数如下表所示,其中的mAPtest50-95(e2e)指标指IoU从0.5到0.95多个阈值下的平均精度,用于评估评估模型在高难度、高精度需求下的性能,而mAPtest50(e2e)指标指在IoU=0.5单一阈值下的平均精度,用于快速对比基线模型,或对定位精度要求不高的任务。

定向目标检测器的输出是一组旋转的边界框,这些边界框精确地包围了图像中的目标,以及每个框的类别标签和置信度分数。当目标以各种角度出现时,定向边界框特别有用,例如在航空图像中,传统的轴对齐边界框可能包含不必要的背景。
YOLO26的旋转框检测模型的输出数据形状为[N,7](检测)或[N,8](追踪),也即result.obb. data的数据形状,其中N为从图片中检测到的目标个数,第二个维度则是目标的位置及置信度信息。

模型检测结果中的obb.xywhr属性保存检测到所有目标的边界框及旋转角度,obb.xyxyxyxy属性的数据形状为[N,4,2],保存所有目标的边界框四个角的坐标。不过将旋转框检测模型转换为onnx格式后,其输出形状变为[1,300,7],具体解析方式后续再学习。

YOLO26的旋转框检测模型是在DOTAv1数据集上进行的预训练,分类只有14种,其使用示例、运行效果(测试图片来自百度图片)、数据形式如下所示:
python
from ultralytics import YOLO
# Load a model
model = YOLO(r"E:\MyPrograms\Python\ultralytics\yolo26m-obb.pt")
# Predict with the model
results = model("ship.jpg")
# Access the results
for result in results:
print(result.obb.data)
print(result.obb.xywhr)
print(result.obb.xyxyxyxy)
print(result.names)
result.show()


参考文献:
1\]https://docs.ultralytics.com/zh/models/yolo26/ \[2\]https://docs.ultralytics.com/zh/tasks/obb/ \[3\]https://deepwiki.com/ultralytics/ultralytics/5.2-annotation-and-plotting-utilities#obb \[4\]https://github.com/ultralytics/ultralytics/blob/main/ultralytics/cfg/datasets/DOTAv1.yaml