GUI界面截图](https://static.likecs.com/default/img_convert.png

基于matlab的行人和车辆检测系统【目标检测】基于计算机视觉，含GUI界面算法：二帧差分法，三帧差分法，混合高斯建模，ViBe算法。功能：对视频中出现的动态目标进行逐帧作差分析或ViBe算法检测，使运动的行人或汽车与背景分割出来，达到检测目的。代码结构清晰，含有注释，运算速度快，可扩展。

在监控视频里准确抓取移动目标这事，说难不难但坑不少。今天咱们拆解一个用Matlab实现的检测系统，支持四种经典算法还带图形界面。直接上干货，先看效果再聊实现。

二帧差分法的暴力美学

最简单粗暴的检测方法莫过于帧间差分。下面这段代码演示如何用当前帧与前帧做绝对值差：

matlab 复制代码

% 读取连续两帧
frame_pre = rgb2gray(vidFrame(:,:,:,t-1)); 
frame_curr = rgb2gray(vidFrame(:,:,:,t));

% 计算差分矩阵
diff_frame = imabsdiff(frame_curr, frame_pre);

% 二值化处理
threshold = 25; % 经验阈值
bw_mask = diff_frame > threshold;

% 形态学处理
se = strel('disk',3);
bw_mask = imopen(bw_mask, se);

注意imabsdiff比直接相减更稳定，能避免负值溢出。实际测试中，阈值选25-30对车辆检测效果最佳，但行人可能需要调整到15左右。这种方法的优势是运算速度飞快，实测1080P视频在i5处理器上能达到150fps，但缺点也很明显------目标内部容易出现空洞（比如车身中部差分不明显）。

三帧差分补刀术

为解决目标不完整的问题，三帧差分法引入中间帧作为过渡：

matlab 复制代码

% 获取三帧数据
frame1 = rgb2gray(vidFrame(:,:,:,t-2));
frame2 = rgb2gray(vidFrame(:,:,:,t-1)); 
frame3 = rgb2gray(vidFrame(:,:,:,t));

% 两次差分求交集
diff1 = imbinarize(imabsdiff(frame2, frame1), 0.1);
diff2 = imbinarize(imabsdiff(frame3, frame2), 0.1);
bw_mask = diff1 & diff2; 

% 填补空洞
bw_mask = imfill(bw_mask, 'holes');

这里使用逻辑与操作确保只有连续运动的区域被保留。有个细节值得注意------形态学闭运算能有效连接断裂的轮廓，但核尺寸过大会导致目标膨胀失真。建议根据目标大小动态调整，比如对车辆检测用5×5矩形核，行人则用3×3椭圆核。

混合高斯建模的智慧

面对光线变化等复杂场景，背景建模才是正解。Matlab自带的vision.ForegroundDetector虽然方便，但自己实现更可控：

matlab 复制代码

classdef GMM_Detector
    properties
        learning_rate = 0.005;
        num_gaussians = 3;
        bg_model; % 每个像素对应3个高斯分布
    end
    
    methods
        function update(obj, frame)
            % 更新高斯参数
            for i=1:size(frame,1)
                for j=1:size(frame,2)
                    pixel = double(frame(i,j));
                    matched = false;
                    % 判断是否匹配现有分布
                    for k=1:obj.num_gaussians
                        mean = obj.bg_model(i,j).gaussians(k).mean;
                        var = obj.bg_model(i,j).gaussians(k).var;
                        if abs(pixel-mean) < 2.5*sqrt(var)
                            % 更新匹配的高斯
                            new_mean = (1-obj.learning_rate)*mean + ...
                                      obj.learning_rate*pixel;
                            new_var = (1-obj.learning_rate)*var + ...
                                     obj.learning_rate*(pixel-new_mean)^2;
                            obj.bg_model(i,j).gaussians(k) = ...
                                struct('mean',new_mean, 'var',new_var);
                            matched = true;
                            break;
                        end
                    end
                    % 未匹配则替换权重最小的分布
                    if ~matched
                        [~, idx] = sort([obj.bg_model(i,j).gaussians.var]);
                        obj.bg_model(i,j).gaussians(idx(1)) = ...
                            struct('mean',pixel, 'var',50); % 初始方差
                    end
                end
            end
        end
    end
end

这段代码实现的核心是每个像素用3个高斯分布建模。learning_rate控制模型更新速度，数值越小对光照变化越鲁棒。实测发现将方差初始值设为50，能快速适应停车场等渐变光照场景。

ViBe算法的神来之笔

要说实时性与准确性兼顾，还得看ViBe。其精妙之处在于随机更新策略：

matlab 复制代码

function bg_model = vibe_init(frame, N)
    % 初始化背景模型
    [h,w] = size(frame);
    bg_model = struct('samples', zeros(h,w,N), 'count', N);
    
    % 填充样本
    for i=1:h
        for j=1:w
            neighbors = frame(max(i-1,1):min(i+1,h), max(j-1,1):min(j+1,w));
            bg_model.samples(i,j,:) = randsample(neighbors(:), N, true);
        end
    end
end

function fg_mask = vibe_detect(frame, bg_model, R, min_matches)
    % 检测前景
    fg_mask = false(size(frame));
    for i=1:size(frame,1)
        for j=1:size(frame,2)
            pixel = frame(i,j);
            samples = bg_model.samples(i,j,:);
            % 统计匹配样本数
            matches = sum(abs(samples - pixel) < R);
            if matches < min_matches
                fg_mask(i,j) = true;
                % 随机更新样本库
                if rand() < 1/16  % 更新概率
                    bg_model.samples(i,j, randi(bg_model.count)) = pixel;
                    % 传播更新到邻域
                    if rand() < 1/5
                        ni = i + randi([-1,1]);
                        nj = j + randi([-1,1]);
                        if ni>0 && ni<=size(frame,1) && nj>0 && nj<=size(frame,2)
                            bg_model.samples(ni,nj, randi(bg_model.count)) = pixel;
                        end
                    end
                end
            end
        end
    end
end

ViBe的两个神来之笔：1）用邻域像素初始化样本库，避免空洞；2）1/16的更新概率既保证模型适应性，又防止幽灵现象。实际部署时，建议R值取10-15，min_matches设为2，这样在树叶晃动等场景下误检率最低。

GUI交互设计要点

用Matlab的App Designer搭建界面时，核心是视频流处理回调：

matlab 复制代码

% 开始按钮回调
function StartButtonPushed(app, ~)
    while app.isRunning
        frame = readFrame(app.vidObj);
        
        % 根据下拉菜单选择算法
        switch app.AlgoSelector.Value
            case '二帧差分'
                detect_frame = frame_diff2(app, frame);
            case 'ViBe'
                detect_frame = vibe_detect(app, frame);
        end
        
        % 实时显示
        imshow(detect_frame, 'Parent', app.ResultAxes);
        drawnow;
    end
end

% 滑动条调整阈值
function ThresholdSliderValueChanged(app, ~)
    app.currentThreshold = app.ThresholdSlider.Value;
    % 即时更新检测效果
    if app.isRunning  
        frame = get(app.VideoAxes, 'CData');
        detect_frame = process_frame(app, frame);
        imshow(detect_frame, 'Parent', app.ResultAxes);
    end
end

这里有个坑------Matlab的imshow会重置坐标轴属性，记得在循环前用hold on保持绘图区域。另外视频流读取建议预加载到内存，避免实时读盘导致的卡顿。测试发现将视频转为MAT格式存储，处理速度能提升3倍以上。

性能优化黑科技

想再提速？试试这些骚操作：

将RGB转灰度放在GPU上：

matlab 复制代码

gpuFrame = gpuArray(frame);
grayFrame = rgb2gray(gpuFrame); % 比CPU快8倍

对差分结果用积分图加速连通域分析
开启Matlab的MKL线程池：

matlab 复制代码

setenv('MKL_NUM_THREADS','4');

实测在1080P视频上，ViBe算法经GPU加速后可达45fps，完全满足实时性需求。

这套系统的扩展性极强，比如要接入深度学习检测器，只需在算法选择分支里加入：

matlab 复制代码

case 'YOLOv5'
    detect_frame = yolov5_detect(app, frame);

但要注意模型转换------建议先将PyTorch模型转成ONNX再导入Matlab，避免版本兼容问题。