帧差法
由于场景中的目标在运动,目标的影像在不同图像帧中的位置不同。该类算法对时间上连续的两帧图像进行差分运算,不同帧对应的像素点相减,判断灰度差的绝对值,当绝对值超过一定阈值时,即可判断为运动目标,从而实现目标的检测功能。
- 帧差法非常简单,但是会引入噪音和空洞问题
混合高斯模型
在进行前景检测前,先对背景进行训练,对图像中每个背景采用一个混合高斯模型进行模拟,每个背景的混合高斯的个数可以自适应。然后在测试阶段,对新来的像素进行GMM匹配,如果该像素值能够匹配其中一个高斯,则认为是背景,否则认为是前景。由于整个过程GMM模型在不断更新学习中,所以对动态背景有一定的鲁棒性。最后通过对一个有树枝摇摆的动态背景进行前景检测,取得了较好的效果。
混合高斯模型(Gaussian Mixture Model, GMM)是一种统计模型,用于表示具有多个峰值的数据分布。它是由多个高斯分布(也称为正态分布)组合而成的,每个高斯分布被称为一个组分。GMM广泛应用于聚类、密度估计和模式识别等领域。
原理:
混合高斯模型的基本思想是通过多个高斯分布的线性组合来拟合数据的整体分布。模型中每个高斯分布负责描述数据中的一个群(cluster)。
每个高斯分布组分由三个参数定义:
- 均值(Mean):描述该分布中心的位置。
- 协方差(Covariance):描述分布的宽度及其方向。
- 混合权重(Mixture Weight):每个高斯分布在模型中的占比,确保所有分布的混合权重之和为1。
学习方法:
GMM通常使用极大似然估计方法进行参数估计,最常用的算法是期望最大化(EM)算法。EM算法通过迭代两个步骤来求解:
- 期望步(E-step):根据当前参数估计,计算每个数据点属于各个高斯分布的概率(软聚类)。
- 最大化步(M-step):更新每个高斯分布的参数,使得似然函数最大化。
应用场景:
- 聚类分析:GMM可以进行软聚类,即允许数据点以一定的概率属于多个群。这一特性使得GMM在某些应用中比硬聚类方法(如K-means)更为适用。
- 图像分割:在图像处理中,可以使用GMM对像素点进行聚类,以实现图像的区域分割。
- 语音识别:在语音信号的特征空间中,使用GMM来模拟音频数据的统计特性。
- 异常检测:GMM能够估计数据的整体分布,因此可以用来识别那些不符合预期分布的异常点。
混合高斯模型以其灵活性和强大的表达能力,在多个领域内有着广泛的应用。
- 算法假设 在视频中对于像素点的变化情况应当是符合高斯分布
- 背景的实际分布应当是多个高斯分布混合在一起,每个高斯模型也可以带有权重
混合高斯模型学习方法
-
1.首先初始化每个高斯模型矩阵参数。
-
2.取视频中T帧数据图像用来训练高斯混合模型。来了第一个像素之后用它来当做第一个高斯分布。
-
3.当后面来的像素值时,与前面已有的高斯的均值比较,如果该像素点的值与其模型均值差在3倍的方差内,则属于该分布,并对其进行参数更新。
-
4.如果下一次来的像素不满足当前高斯分布,用它来创建一个新的高斯分布。
混合高斯模型背景建模测试方法
混合高斯模型在背景建模中主要应用于视频监控系统中用于动态背景的检测和分析。该技术通过分析视频帧中的每个像素点随时间变化的统计特性,使用多个高斯分布来表示各个像素点的颜色变化,从而区分出背景和前景(如移动的对象)。这使得系统能够有效地识别和追踪视频中的动态对象,如行人、车辆等,同时忽略由光照变化、树木摇动等因素引起的背景噪声。此方法对于提高视频监控的准确性和效率具有重要作用。
在测试阶段,对新来像素点的值与混合高斯模型中的每一个均值进行比较,如果其差值在2倍的方差之间的话,则认为是背景,否则认为是前景。将前景赋值为255,背景赋值为0。这样就形成了一副前景二值图。
python
import numpy as np
import cv2
#经典的测试视频
cap = cv2.VideoCapture('test.avi')
#形态学操作需要使用
kernel = cv2.getStructuringElement(cv2.MORPH_ELLIPSE,(3,3))
#创建混合高斯模型用于背景建模
fgbg = cv2.createBackgroundSubtractorMOG2()
while(True):
ret, frame = cap.read()
fgmask = fgbg.apply(frame)
#形态学开运算去噪点
fgmask = cv2.morphologyEx(fgmask, cv2.MORPH_OPEN, kernel)
#寻找视频中的轮廓
im, contours, hierarchy = cv2.findContours(fgmask, cv2.RETR_EXTERNAL, cv2.CHAIN_APPROX_SIMPLE)
for c in contours:
#计算各轮廓的周长
perimeter = cv2.arcLength(c,True)
if perimeter > 188:
#找到一个直矩形(不会旋转)
x,y,w,h = cv2.boundingRect(c)
#画出这个矩形
cv2.rectangle(frame,(x,y),(x+w,y+h),(0,255,0),2)
cv2.imshow('frame',frame)
cv2.imshow('fgmask', fgmask)
k = cv2.waitKey(150) & 0xff
if k == 27:
break
cap.release()
cv2.destroyAllWindows()