Yolo-World初步使用

Lydro2024-08-09 22:55

Yolo v8目前已经支持Yolo-World，整理一下初步使用步骤。

使用步骤

1 先下载Yolo-World的pt文件，下载地址：GitHub - AILab-CVC/YOLO-World: [CVPR 2024] Real-Time Open-Vocabulary Object Detection

官网应该是点这里（有个笑脸）下载，我一直刷不出来界面，所以不确定：

我自己用的是在其他网友提供的地址下载的，应该是V1版本（yolov8-world.pt），目前已经出了V2版本。

2 新建一个python脚本，叫testYolo-World.py，这里我们使用Yolo v8自带的bus.jpg进行测试。

python 复制代码

from ultralytics import YOLOWorld


# 目标检测
# Load a model
model = YOLOWorld('data/yolov8s-world.pt')  # load a pretrained model

# Define custom classes
model.set_classes(['glasses'])

#model.save("data/yolov8s-world2.pt")

# Run inference on 'bus.jpg' with arguments
results = model.predict('data/bus.jpg',save=True, imgsz=640)

运行过程中，会提示缺失CLIP库，然后等待一会，会自动安装。安装成功后，再次运行一遍，会出结果，能检测到glasses.

但是尝试了其他类别，'tree' 'window' 'clothes' 'shoes'，除了'shoes'，其他都检测不出来，不知道V2效果会不会好一点。

如果注释掉设置类别这句话，能检测到的类别和Yolo v8自带的pt文件检测类别基本一致，置信度很高，但是有一个错误，多检测出来一个person。