OpenCV 背景建模实战:三种方法实现运动目标检测

一、背景建模概述

在计算机视觉领域,背景建模是从视频序列中提取静态背景、分离动态前景的核心技术,广泛应用于运动检测、目标跟踪、行为分析等场景。

简单来说,背景就是视频中相对稳定的部分(如墙壁、地面),前景则是运动的目标(如行人、车辆)。背景建模的目标就是构建一个可靠的背景模型,将两者精准分离。

二、三种主流背景建模方法

1. 帧差法(Frame Difference)

原理:对连续两帧图像做差分运算,计算像素灰度差的绝对值,超过阈值则判定为运动目标。公式如下:

优缺点

  • 实现简单、计算速度快
  • 易受光照变化影响,会产生噪声和空洞(如目标内部出现黑色区域)

2. K 近邻背景建模(KNN)

原理:为每个像素维护一个历史样本集,新像素值与样本集中的 K 个样本做距离比对,若多数样本相似则判定为背景,否则为前景。

优缺点

  • 对光照变化和动态背景(如树叶晃动)有一定鲁棒性
  • 计算量较大,内存占用较高

3. 高斯混合模型(MOG2)

原理:用多个高斯分布来建模每个像素的颜色分布,通过在线 EM 算法更新模型参数,能自适应学习背景变化。

优缺点

  • 鲁棒性强,能处理复杂背景和光照渐变
  • 初始建模需要一定时间,参数调优较复杂

三、代码实现:

python 复制代码
import cv2
import numpy as np

# 测试视频路径
video_path = 'test.avi'

# 初始化三种背景建模器
fgbg_mog2 = cv2.createBackgroundSubtractorMOG2(history=500, detectShadows=True)
fgbg_knn = cv2.createBackgroundSubtractorKNN(history=500, detectShadows=True)

# 卷积核,用于形态学操作去噪
kernel = cv2.getStructuringElement(cv2.MORPH_CROSS, ksize=(3, 3))

cap = cv2.VideoCapture(video_path)
if not cap.isOpened():
    print("视频打开失败!")
    exit()

while True:
    ret, frame = cap.read()
    if not ret:
        break

    # ---------------------- 1. 帧差法 ----------------------
    if 'prev_frame' not in locals():
        prev_frame = frame.copy()
        continue
    frame_diff = cv2.absdiff(frame, prev_frame)
    _, thresh_diff = cv2.threshold(frame_diff, 30, 255, cv2.THRESH_BINARY)
    thresh_diff = cv2.cvtColor(thresh_diff, cv2.COLOR_BGR2GRAY)
    thresh_diff = cv2.morphologyEx(thresh_diff, cv2.MORPH_OPEN, kernel)
    prev_frame = frame.copy()

    # ---------------------- 2. KNN 方法 ----------------------
    fgmask_knn = fgbg_knn.apply(frame)
    fgmask_knn = cv2.morphologyEx(fgmask_knn, cv2.MORPH_OPEN, kernel)

    # ---------------------- 3. MOG2 方法 ----------------------
    fgmask_mog2 = fgbg_mog2.apply(frame)
    fgmask_mog2 = cv2.morphologyEx(fgmask_mog2, cv2.MORPH_OPEN, kernel)

    # ---------------------- 轮廓检测与可视化 ----------------------
    def draw_contours(img, mask):
        _, contours, _ = cv2.findContours(mask, cv2.RETR_EXTERNAL, cv2.CHAIN_APPROX_SIMPLE)
        for c in contours:
            perimeter = cv2.arcLength(c, closed=True)
            if perimeter > 188:
                x, y, w, h = cv2.boundingRect(c)
                cv2.rectangle(img, (x, y), (x+w, y+h), (0, 255, 0), 2)
        return img

    frame_diff_rect = draw_contours(frame.copy(), thresh_diff)
    frame_knn_rect = draw_contours(frame.copy(), fgmask_knn)
    frame_mog2_rect = draw_contours(frame.copy(), fgmask_mog2)

    # ---------------------- 显示结果 ----------------------
    cv2.imshow('Original Frame', frame)
    cv2.imshow('Frame Difference', frame_diff_rect)
    cv2.imshow('KNN Background Subtraction', frame_knn_rect)
    cv2.imshow('MOG2 Background Subtraction', frame_mog2_rect)

    k = cv2.waitKey(30) & 0xff
    if k == 27:  # ESC 退出
        break

cap.release()
cv2.destroyAllWindows()

四、代码讲解

python 复制代码
fgbg_mog2 = cv2.createBackgroundSubtractorMOG2(history=500, detectShadows=True)
fgbg_knn = cv2.createBackgroundSubtractorKNN(history=500, detectShadows=True)

初始化两种高级背景建模器:

  • MOG2:混合高斯模型,自适应背景、抗光照
  • KNN :K 近邻模型,对动态背景(树叶、水波)更鲁棒history=500 表示用 500 帧学习背景,detectShadows=True 开启阴影检测。
python 复制代码
kernel = cv2.getStructuringElement(cv2.MORPH_CROSS, ksize=(3, 3))

创建 3×3 十字形结构核,用于后续开运算去噪 ,消除小噪点让前景更干净。

python 复制代码
cap = cv2.VideoCapture(video_path)
if not cap.isOpened():
    print("视频打开失败!")
    exit()

打开视频文件,并判断是否成功打开;失败则提示并退出,避免程序崩溃。

python 复制代码
while True:
    ret, frame = cap.read()
    if not ret:
        break

循环读取视频每一帧。

  • ret:是否成功读到帧
  • frame:当前帧图像读到视频末尾自动退出循环。
python 复制代码
    # 帧差法
    if 'prev_frame' not in locals():
        prev_frame = frame.copy()
        continue
    frame_diff = cv2.absdiff(frame, prev_frame)
    _, thresh_diff = cv2.threshold(frame_diff, 30, 255, cv2.THRESH_BINARY)
    thresh_diff = cv2.cvtColor(thresh_diff, cv2.COLOR_BGR2GRAY)
    thresh_diff = cv2.morphologyEx(thresh_diff, cv2.MORPH_OPEN, kernel)
    prev_frame = frame.copy()

实现帧差法(最简单的运动检测):

  1. 保存上一帧
  2. 计算当前帧与上一帧差值
  3. 二值化分离前景背景
  4. 转灰度图 + 开运算去噪
  5. 更新上一帧
python 复制代码
    # KNN
    fgmask_knn = fgbg_knn.apply(frame)
    fgmask_knn = cv2.morphologyEx(fgmask_knn, cv2.MORPH_OPEN, kernel)

使用 KNN 背景建模得到前景掩码,再通过形态学开运算去除小白点噪点。

python 复制代码
    # MOG2
    fgmask_mog2 = fgbg_mog2.apply(frame)
    fgmask_mog2 = cv2.morphologyEx(fgmask_mog2, cv2.MORPH_OPEN, kernel)

使用 MOG2 混合高斯模型得到前景掩码,同样做去噪处理。

python 复制代码
    def draw_contours(img, mask):
        _, contours, _ = cv2.findContours(mask, cv2.RETR_EXTERNAL, cv2.CHAIN_APPROX_SIMPLE)
        for c in contours:
            perimeter = cv2.arcLength(c, closed=True)
            if perimeter > 188:
                x, y, w, h = cv2.boundingRect(c)
                cv2.rectangle(img, (x, y), (x+w, y+h), (0, 255, 0), 2)
        return img

定义轮廓绘制函数:

  • 寻找前景轮廓
  • 根据轮廓周长过滤小噪声(只保留大于 188 的目标)
  • 绘制绿色外接矩形,标记运动目标
python 复制代码
    frame_diff_rect = draw_contours(frame.copy(), thresh_diff)
    frame_knn_rect = draw_contours(frame.copy(), fgmask_knn)
    frame_mog2_rect = draw_contours(frame.copy(), fgmask_mog2)

分别对帧差法、KNN、MOG2三种结果绘制目标框。

五、结果展示:

相关推荐
TeDi TIVE3 小时前
开源模型应用落地-工具使用篇-Spring AI-高阶用法(九)
人工智能·spring·开源
MY_TEUCK3 小时前
Sealos 平台部署实战指南:结合 Cursor 与版本发布流程
java·人工智能·学习·aigc
三毛的二哥4 小时前
BEV:典型BEV算法总结
人工智能·算法·计算机视觉·3d
j_xxx404_4 小时前
大语言模型 (LLM) 零基础入门:核心原理、训练机制与能力全解
人工智能·ai·transformer
飞哥数智坊4 小时前
全新 SOLO 在日常办公中的实际体验
人工智能·solo
<-->4 小时前
Megatron(全称 Megatron-LM,由 NVIDIA 开发)和 DeepSpeed(由 Microsoft 开发)
人工智能·pytorch·python·深度学习·transformer
朝新_4 小时前
【Spring AI 】图像与语音模型实战
java·人工智能·spring
Yuanxl9035 小时前
神经网络-Sequential 应用与实战
人工智能·深度学习·神经网络
火山引擎开发者社区5 小时前
Seedance 2.0 1080P 生成能力正式上线
人工智能
冬奇Lab5 小时前
一天一个开源项目(第79篇):生化危机女主角亲自开源的 AI 记忆系统 MemPalace
人工智能·开源·资讯