OpenCV实现目标追踪

目录

准备工作

语言:

软件包:

效果演示

代码解读

(1)导入OpenCV库

[(2)使用 cv2.VideoCapture 打开指定路径的视频文件](#(2)使用 cv2.VideoCapture 打开指定路径的视频文件)

[(3)使用 vid.read() 读取视频的第一帧,ret 表示是否成功读取,fr 包含实际的视频帧](#(3)使用 vid.read() 读取视频的第一帧,ret 表示是否成功读取,fr 包含实际的视频帧)

(4)弹出一个窗口,然后我们通过拖动鼠标选择需要跟踪的区域(ROI)。选择的ROI作为一个元组(initial_box)返回,表示对象跟踪的初始边界框

[(5)创建一个KCF(Kernelized Correlation Filters)跟踪器,并使用初始边界框在第一帧上初始化](#(5)创建一个KCF(Kernelized Correlation Filters)跟踪器,并使用初始边界框在第一帧上初始化)

[(6)获取视频的原始帧率,然后计算等待时间,确保每秒有 original_fps 帧](#(6)获取视频的原始帧率,然后计算等待时间,确保每秒有 original_fps 帧)

(7)开始一个循环,读取视频的每一帧,如果没有更多的帧可读,退出循环

(8)使用跟踪器更新并跟踪对象。如果跟踪成功,获取边界框的坐标,然后在当前帧上绘制一个矩形

[(9)在窗口中显示带有跟踪结果的当前帧,然后等待 wait_time 毫秒。](#(9)在窗口中显示带有跟踪结果的当前帧,然后等待 wait_time 毫秒。)

[(10)按下 'q' 键,退出循环,退出程序](#(10)按下 'q' 键,退出循环,退出程序)

(11)循环结束后,释放视频捕获对象和关闭所有OpenCV窗口

总体代码

总结


最近有一直在玩无人机,但是局限于财力买的是很入门的款式,然后我也关注过更高级的无人机,例如大疆的mini4pro,他们有一个功能是选取视频中的框然后就可以实时的跟踪锁定这一个物体,例如跟车或者跟随人物等更加的有利于航拍。

那么我虽然开发不了一个能集成到无人机飞控系统中的这样的软件,我就在思考能不能做一个小程序可以实时框选目标然后跟踪它。


准备工作

语言:

在使用的语言之中我采用了Python来进行实现,因为Python的软件包是实在是很多,例如我们这次的程序就需要用到这个东西。

软件包:

这次的程序和我之前的OpenCV程序比起来要简单很多,只使用了CV2也就是OpenCV这么一个软件包。


效果演示


代码解读

(1)导入OpenCV库

python 复制代码
import cv2

(2)使用 cv2.VideoCapture 打开指定路径的视频文件

python 复制代码
# 打开视频文件
vid = cv2.VideoCapture("D:\\Dji\\00002\\DJI_0029.MP4")

(3)使用 vid.read() 读取视频的第一帧,ret 表示是否成功读取,fr 包含实际的视频帧

python 复制代码
# 读取第一帧
ret, fr = vid.read()

(4)弹出一个窗口,然后我们通过拖动鼠标选择需要跟踪的区域(ROI)。选择的ROI作为一个元组(initial_box)返回,表示对象跟踪的初始边界框

python 复制代码
# 选择初始边界框
initial_box = cv2.selectROI("Select ROI", fr, fromCenter=False, showCrosshair=True)

(5)创建一个KCF(Kernelized Correlation Filters)跟踪器,并使用初始边界框在第一帧上初始化

python 复制代码
# 初始化跟踪器
tracker = cv2.TrackerKCF_create()
tracker.init(fr, initial_box)

(6)获取视频的原始帧率,然后计算等待时间,确保每秒有 original_fps

python 复制代码
# 获取视频的原始帧率
original_fps = vid.get(cv2.CAP_PROP_FPS)
wait_time = int(1000 / original_fps) if original_fps > 0 else 1  # 计算等待时间,确保每秒有 original_fps 帧

(7)开始一个循环,读取视频的每一帧,如果没有更多的帧可读,退出循环

python 复制代码
while True:
    # 读取视频帧
    ret, fr = vid.read()
    if not ret:
        break

(8)使用跟踪器更新并跟踪对象。如果跟踪成功,获取边界框的坐标,然后在当前帧上绘制一个矩形

python 复制代码
    # 进行跟踪
    (success, box) = tracker.update(fr)
    if success:
        (x, y, w, h) = [int(v) for v in box]
        cv2.rectangle(fr, (x, y), (x + w, y + h), (255, 255, 0), 1)

(9)在窗口中显示带有跟踪结果的当前帧,然后等待 wait_time 毫秒。

为什么这里要等待,因为如果不等待的话视频的播放速度就是根据你的电脑的性能,一般都会导致视频加速。

python 复制代码
    # 显示跟踪结果
    cv2.imshow("Output Frame", fr)
    key = cv2.waitKey(wait_time) & 0xFF

(10)按下 'q' 键,退出循环,退出程序

python 复制代码
    # 按下 'q' 键退出循环
    if key == ord('q'):
        break

(11)循环结束后,释放视频捕获对象和关闭所有OpenCV窗口

python 复制代码
# 释放资源
vid.release()
cv2.destroyAllWindows()

总体代码

python 复制代码
import cv2

# 打开视频文件
vid = cv2.VideoCapture("D:\\Dji\\00002\\DJI_0029.MP4")

# 读取第一帧
ret, fr = vid.read()

# 选择初始边界框
initial_box = cv2.selectROI("Select ROI", fr, fromCenter=False, showCrosshair=True)

# 初始化跟踪器
tracker = cv2.TrackerKCF_create()
tracker.init(fr, initial_box)

# 获取视频的原始帧率
original_fps = vid.get(cv2.CAP_PROP_FPS)
wait_time = int(1000 / original_fps) if original_fps > 0 else 1  # 计算等待时间,确保每秒有 original_fps 帧

while True:
    # 读取视频帧
    ret, fr = vid.read()
    if not ret:
        break

    # 进行跟踪
    (success, box) = tracker.update(fr)
    if success:
        (x, y, w, h) = [int(v) for v in box]
        cv2.rectangle(fr, (x, y), (x + w, y + h), (255, 255, 0), 1)

    # 显示跟踪结果
    cv2.imshow("Output Frame", fr)
    key = cv2.waitKey(wait_time) & 0xFF

    # 按下 'q' 键退出循环
    if key == ord('q'):
        break

# 释放资源
vid.release()
cv2.destroyAllWindows()

总结

ヾ( ̄▽ ̄)Bye~Bye~

相关推荐
m0_694845577 分钟前
Dify部署教程:从AI原型到生产系统的一站式方案
服务器·人工智能·python·数据分析·开源
LS_learner9 分钟前
VS Code 终端默认配置从 PowerShell 改为 CMD
人工智能
Fcy64824 分钟前
算法基础详解(三)前缀和与差分算法
算法·前缀和·差分
kvo7f2JTy33 分钟前
基于机器学习算法的web入侵检测系统设计与实现
前端·算法·机器学习
List<String> error_P1 小时前
蓝桥杯最后几天冲刺:暴力大法(一)
算法·职场和发展·蓝桥杯
小毅&Nora1 小时前
【人工智能】【大模型】大模型“全家桶”到“精兵简政”:企业AI落地的理性进化之路
人工智能·大模型·平安科技
李昊哲小课1 小时前
Python办公自动化教程 - 第7章 综合实战案例 - 企业销售管理系统
开发语言·python·数据分析·excel·数据可视化·openpyxl
KaneLogger1 小时前
如何把AI方面的先发优势转化为结构优势
人工智能·程序员·架构
冬奇Lab2 小时前
一天一个开源项目(第67篇):OpenClaw-Admin - AI Agent 网关的可视化管理驾驶舱
人工智能·开源·资讯
飞哥数智坊2 小时前
【大纲】TRAE AI 编程入门第四讲——打破编程界限的智能体
人工智能·ai编程·trae