OpenCV ：基于 Lucas-Kanade 算法的视频光流估计实现

一、光流估计基础认知

[1.1 什么是光流估计？](#1.1 什么是光流估计？)

[1.2 光流估计的 3 个核心前提](#1.2 光流估计的 3 个核心前提)

[二、核心算法：Lucas-Kanade 稀疏光流](#二、核心算法：Lucas-Kanade 稀疏光流)

[2.1 算法原理](#2.1 算法原理)

[2.2 关键函数解析](#2.2 关键函数解析)

三、完整代码实现：视频运动轨迹跟踪

[3.1 环境准备](#3.1 环境准备)

[3.2 完整代码](#3.2 完整代码)

[3.3 代码说明](#3.3 代码说明)

四、常见问题与解决方案

[4.1 问题 1：视频无法读取](#4.1 问题 1：视频无法读取)

[4.2 问题 2：特征点跟踪丢失](#4.2 问题 2：特征点跟踪丢失)

[4.3 问题 3：运行卡顿](#4.3 问题 3：运行卡顿)

五、扩展应用场景

在计算机视觉领域，光流估计是分析视频中运动目标的核心技术之一，它通过计算图像像素的 "瞬时速度"，实现对目标运动轨迹的跟踪。本文将结合 OpenCV 库，详细讲解 Lucas-Kanade 光流估计算法的原理，并提供完整的视频运动轨迹跟踪代码。

一、光流估计基础认知

1.1 什么是光流估计？

光流估计是指空间运动物体在图像平面上像素运动的瞬时速度，它能反映相邻帧之间像素的位置变化。通过光流向量，我们可以判断目标的运动方向和速度，常用于目标跟踪、运动检测、视频防抖等场景。

1.2 光流估计的 3 个核心前提

Lucas-Kanade 算法作为经典的稀疏光流算法，依赖以下 3 个假设才能有效工作：

亮度恒定：同一像素在不同帧中，灰度值不会随时间变化（忽略光照突变情况）。
小运动假设：像素在相邻帧中的位置变化很小，可用局部灰度变化近似整体运动。
空间一致性：相邻像素具有相同的运动趋势（例如同一物体的表面像素），可通过邻域信息约束运动向量。

二、核心算法：Lucas-Kanade 稀疏光流

2.1 算法原理

Lucas-Kanade（LK）算法是典型的稀疏光流算法，它不计算所有像素的光流，而是先通过角点检测（如 Shi-Tomasi 角点检测）提取 "特征点"，再跟踪这些特征点的运动轨迹。

其核心逻辑是：

对前一帧图像，用 Shi-Tomasi 算法检测角点（角点具有稳定的灰度变化，适合跟踪）。
对相邻帧，以特征点为中心建立小窗口，通过最小化窗口内灰度误差，求解特征点的运动向量。
筛选跟踪成功的特征点，绘制运动轨迹并更新帧数据，循环迭代。

2.2 关键函数解析

在 OpenCV 中，实现 LK 光流估计需用到 2 个核心函数，其参数和作用如下：

函数	作用	关键参数说明
`cv2.goodFeaturesToTrack()`	提取前一帧的角点特征	`maxCorners`：最大角点数量；`qualityLevel`：角点质量阈值（小于该值的角点会被过滤）；`minDistance`：角点间最小欧式距离（避免角点密集）
`cv2.calcOpticalFlowPyrLK()`	计算特征点的光流	`winSize`：搜索窗口大小（窗口越大，跟踪越稳定但速度越慢）；`maxLevel`：金字塔层数（多尺度跟踪，提升大运动目标的跟踪效果）；`status`：跟踪状态（1 表示成功，0 表示失败）

三、完整代码实现：视频运动轨迹跟踪

3.1 环境准备

首先确保已安装指定版本的 OpenCV 库（避免版本兼容问题），执行以下命令安装：

python 复制代码

pip install opencv-python==3.4.18.65
pip install opencv-contrib-python==3.4.18.65

3.2 完整代码

python 复制代码

import numpy as np
import cv2

# 1. 打开视频文件（替换为你的视频路径，也可使用摄像头：cap = cv2.VideoCapture(0)）
cap = cv2.VideoCapture('test.avi')

# 2. 随机生成100种颜色，用于绘制不同特征点的轨迹
color = np.random.randint(0, 255, (100, 3))

# 3. 读取第一帧，作为跟踪的初始帧
ret, old_frame = cap.read()
if not ret:
    print("无法读取视频文件，请检查路径！")
    exit()

# 4. 将初始帧转换为灰度图（光流计算需单通道图像）
old_gray = cv2.cvtColor(old_frame, cv2.COLOR_BGR2GRAY)

# 5. 定义Shi-Tomasi角点检测参数
feature_params = dict(
    maxCorners=100,        # 最多检测100个角点
    qualityLevel=0.3,      # 角点质量阈值（过滤低质量角点）
    minDistance=7          # 角点间最小距离（避免密集）
)

# 6. 提取初始帧的角点
p0 = cv2.goodFeaturesToTrack(old_gray, mask=None, **feature_params)

# 7. 创建掩模（用于绘制轨迹，与视频帧尺寸一致）
mask = np.zeros_like(old_frame)

# 8. 定义Lucas-Kanade光流参数
lk_params = dict(
    winSize=(15, 15),      # 搜索窗口大小（15x15）
    maxLevel=2             # 金字塔层数（2层，平衡速度与精度）
)

# 9. 主循环：逐帧处理视频
while True:
    # 读取当前帧
    ret, frame = cap.read()
    if not ret:  # 视频读取完毕或出错，退出循环
        break
    
    # 将当前帧转换为灰度图
    frame_gray = cv2.cvtColor(frame, cv2.COLOR_BGR2GRAY)
    
    # 10. 计算光流：跟踪特征点从old_gray到frame_gray的运动
    p1, st, err = cv2.calcOpticalFlowPyrLK(
        prevImg=old_gray,    # 前一帧灰度图
        nextImg=frame_gray,  # 当前帧灰度图
        prevPts=p0,          # 前一帧的特征点
        nextPts=None,        # 输出当前帧的特征点（自动计算）
        **lk_params
    )
    
    # 11. 筛选跟踪成功的特征点（st=1表示跟踪成功）
    good_new = p1[st == 1]  # 当前帧中跟踪成功的特征点
    good_old = p0[st == 1]  # 前一帧中对应的特征点
    
    # 12. 绘制特征点的运动轨迹
    for i, (new, old) in enumerate(zip(good_new, good_old)):
        # 获取特征点坐标（转换为整数，避免绘图报错）
        a, b = new.ravel().astype(int)
        c, d = old.ravel().astype(int)
        
        # 在掩模上绘制轨迹线段（连接当前点与前一点）
        mask = cv2.line(mask, (a, b), (c, d), color[i].tolist(), thickness=2)
        # 在当前帧上绘制特征点（红色圆点，便于观察）
        frame = cv2.circle(frame, (a, b), 5, (0, 0, 255), -1)
    
    # 13. 合并当前帧与轨迹掩模，生成最终显示图像
    result = cv2.add(frame, mask)
    
    # 14. 显示结果（两个窗口：原始轨迹掩模 + 带轨迹的视频帧）
    cv2.imshow('Trajectory Mask', mask)
    cv2.imshow('Optical Flow Tracking', result)
    
    # 15. 按键控制：按下Esc键（键码27）退出
    k = cv2.waitKey(150)  # 每帧等待150ms，控制视频播放速度
    if k == 27:
        break
    
    # 16. 更新数据：为下一帧准备（当前帧变为前一帧，当前特征点变为初始特征点）
    old_gray = frame_gray.copy()
    p0 = good_new.reshape(-1, 1, 2)  # 调整特征点形状，适配下一帧计算

# 17. 释放资源（关闭视频流和所有窗口）
cap.release()
cv2.destroyAllWindows()

3.3 代码说明

视频读取 ：支持本地视频文件（需替换test.avi为实际路径）或摄像头（将cap = cv2.VideoCapture('test.avi')改为cap = cv2.VideoCapture(0)）。
轨迹绘制 ：用随机颜色区分不同特征点的轨迹，掩模mask单独存储轨迹，避免污染原始视频帧。
参数调整 ：
- waitKey(150)：调整等待时间可控制视频播放速度（单位 ms，值越小越快）。
- winSize=(15,15)：窗口越大，对模糊视频的跟踪越稳定，但计算速度会变慢。
- maxCorners=100：根据需求调整特征点数量，目标越多可适当增大。

四、常见问题与解决方案

4.1 问题 1：视频无法读取

原因：视频路径错误、视频格式不支持（建议用 AVI、MP4 格式）、摄像头被占用。
解决：检查路径是否正确；用cap.isOpened()判断视频流是否打开，若返回False，尝试更换视频文件或重启摄像头。

4.2 问题 2：特征点跟踪丢失

原因：目标运动过快（超出搜索窗口）、光照突变（破坏亮度恒定假设）、目标遮挡。
解决：增大winSize（如(21,21)）或maxLevel（如 3）；在代码中增加 "重新检测角点" 的逻辑（当good_new数量过少时，调用cv2.goodFeaturesToTrack()重新提取）。

4.3 问题 3：运行卡顿

原因：特征点数量过多、窗口尺寸过大、电脑性能不足。
解决：减少maxCorners（如 50）、减小winSize（如(11,11)）；关闭其他占用资源的程序。

五、扩展应用场景

目标跟踪：在本文代码基础上，添加目标框选功能，可跟踪特定目标（如行人、车辆）。
运动检测：通过分析光流向量的方向和大小，判断是否存在异常运动（如闯入禁区的物体）。
视频防抖：利用光流估计帧间运动，通过图像变换抵消抖动，实现视频稳定。