MATLAB 回声抵消(AEC)、噪声抑制(NS)、自动增益控制(AGC)完整实现

一、系统架构与算法原理

1.1 处理流程

复制代码

麦克风输入 x[n]
    ↓
回声抵消 AEC (参考远端信号 d[n])
    ↓
噪声抑制 NS (谱减法/维纳滤波)
    ↓
自动增益控制 AGC (RMS电平调整)
    ↓
输出纯净语音 y[n]

1.2 核心算法对比

算法	数学原理	计算复杂度	适用场景
NLMS-AEC	自适应FIR滤波，最小化误差	O(L)	声学回声消除
谱减法 NS	频域幅度谱相减	O(N log N)	平稳噪声抑制
维纳滤波	最小均方误差估计	O(N log N)	非平稳噪声抑制
RMS-AGC	滑动窗口能量归一化	O(1)	音量自动调节

二、完整MATLAB实现

2.1 主程序（main_aec_ns_agc.m）

matlab 复制代码

%% 回声抵消 + 噪声抑制 + 自动增益控制 主程序
clear; clc; close all;

%% 1. 生成测试信号
fs = 16000;           % 采样率 16kHz
t = 0:1/fs:5;       % 5秒时长
frame_len = 256;      % 帧长
hop_len = 128;         % 帧移 (50%重叠)
num_frames = floor((length(t)-frame_len)/hop_len) + 1;

% 近端语音（干净语音）
speech_near = 0.5 * sin(2*pi*300*t) .* (1 + 0.5*sin(2*pi*2*t));

% 远端参考信号（回声源）
speech_far = 0.3 * sin(2*pi*800*t + 0.5*sin(2*pi*3*t));

% 回声路径（房间冲激响应）
echo_path = fir1(512, 0.2);  % FIR滤波器模拟回声路径
echo_signal = filter(echo_path, 1, speech_far);

% 麦克风输入 = 近端语音 + 回声 + 环境噪声
noise = 0.02 * randn(size(t));  % 高斯白噪声
mic_input = speech_near + echo_signal + noise;

%% 2. 初始化算法参数
% AEC参数
aec_filter_len = 1024;          % 自适应滤波器长度
aec_mu = 0.5;                 % NLMS步长
aec_leakage = 0.999;           % 泄漏因子

% NS参数
ns_alpha = 0.98;                % 噪声谱平滑系数
ns_beta = 0.05;                % 谱减过减因子
ns_gamma = 0.998;               % 增益平滑系数

% AGC参数
agc_target_rms = 0.1;          % 目标RMS电平
agc_attack_time = 0.01;        % 攻击时间 10ms
agc_release_time = 0.1;        % 释放时间 100ms
agc_max_gain = 10;             % 最大增益
agc_min_gain = 0.1;            % 最小增益

% 初始化状态变量
aec_weights = zeros(aec_filter_len, 1);
noise_psd = zeros(frame_len, 1);
prev_gain = 1.0;
prev_speech_psd = zeros(frame_len, 1);

%% 3. 逐帧处理
output_signal = zeros(size(mic_input));
aec_error = zeros(size(mic_input));
agc_gains = zeros(num_frames, 1);

figure('Position', [100, 100, 1200, 800]);

for frame_idx = 1:num_frames
    % 提取当前帧
    start_idx = (frame_idx-1)*hop_len + 1;
    end_idx = start_idx + frame_len - 1;
    
    if end_idx > length(mic_input)
        break;
    end
    
    x_frame = mic_input(start_idx:end_idx);
    d_frame = speech_far(start_idx:end_idx);  % 远端参考
    
    %% 3.1 回声抵消 (AEC)
    [e_frame, aec_weights] = nlms_aec(x_frame, d_frame, aec_weights, aec_mu, aec_leakage);
    aec_error(start_idx:end_idx) = e_frame;
    
    %% 3.2 噪声抑制 (NS)
    [e_ns_frame, noise_psd] = spectral_subtraction(e_frame, ns_alpha, ns_beta, noise_psd);
    
    %% 3.3 自动增益控制 (AGC)
    [e_agc_frame, curr_gain] = rms_agc(e_ns_frame, agc_target_rms, agc_attack_time, agc_release_time, agc_max_gain, agc_min_gain, prev_gain);
    agc_gains(frame_idx) = curr_gain;
    prev_gain = curr_gain;
    
    % 重叠相加
    if frame_idx == 1
        output_signal(start_idx:end_idx) = e_agc_frame;
    else
        % 重叠部分相加
        overlap = output_signal(start_idx:end_idx);
        output_signal(start_idx:end_idx) = overlap + e_agc_frame(1:length(overlap));
    end
    
    %% 3.4 实时显示
    if mod(frame_idx, 10) == 0
        subplot(4,1,1);
        plot(t(start_idx:end_idx), x_frame, 'b');
        ylabel('Amplitude');
        title('麦克风输入（含回声+噪声）');
        axis tight;
        
        subplot(4,1,2);
        plot(t(start_idx:end_idx), e_frame, 'r');
        ylabel('Amplitude');
        title('AEC输出（回声消除后）');
        axis tight;
        
        subplot(4,1,3);
        plot(t(start_idx:end_idx), e_ns_frame, 'g');
        ylabel('Amplitude');
        title('NS输出（噪声抑制后）');
        axis tight;
        
        subplot(4,1,4);
        plot(t(start_idx:end_idx), e_agc_frame, 'k');
        ylabel('Amplitude');
        xlabel('Time (s)');
        title(['AGC输出（增益=' num2str(curr_gain, '%.2f') ')']);
        axis tight;
        
        drawnow limitrate;
    end
end

%% 4. 性能评估
evaluate_performance(mic_input, output_signal, speech_near, fs);

%% 5. 保存结果
audiowrite('original_mic.wav', mic_input, fs);
audiowrite('processed_output.wav', output_signal, fs);
disp('处理完成！音频文件已保存。');

2.2 回声抵消算法（nlms_aec.m）

matlab 复制代码

function [error_signal, weights] = nlms_aec(mic_frame, far_frame, weights, mu, leakage)
% NLMS自适应回声抵消算法
% 输入:
%   mic_frame: 麦克风输入帧
%   far_frame: 远端参考帧
%   weights: 自适应滤波器系数
%   mu: 步长因子
%   leakage: 泄漏因子
% 输出:
%   error_signal: 回声抵消后的误差信号
%   weights: 更新后的滤波器系数

% 参数
filter_len = length(weights);
frame_len = length(mic_frame);
error_signal = zeros(frame_len, 1);

% 确保输入长度一致
far_frame = far_frame(:);
mic_frame = mic_frame(:);

% NLMS处理
for n = filter_len:frame_len
    % 构造输入向量
    x_vec = far_frame(n:-1:n-filter_len+1);
    
    % 计算滤波器输出
    y_hat = weights' * x_vec;
    
    % 计算误差
    error_signal(n) = mic_frame(n) - y_hat;
    
    % 归一化步长
    eps_norm = 1e-10;  % 防止除零
    norm_factor = leakage * norm(x_vec)^2 + eps_norm;
    
    % 更新权重
    weights = leakage * weights + (mu / norm_factor) * error_signal(n) * x_vec;
end

% 处理前filter_len个点
if filter_len > 1
    error_signal(1:filter_len-1) = mic_frame(1:filter_len-1);
end
end

2.3 噪声抑制算法（spectral_subtraction.m）

matlab 复制代码

function [enhanced_frame, noise_psd] = spectral_subtraction(noisy_frame, alpha, beta, noise_psd)
% 谱减法噪声抑制
% 输入:
%   noisy_frame: 含噪语音帧
%   alpha: 噪声谱平滑系数
%   beta: 过减因子
%   noise_psd: 噪声功率谱估计
% 输出:
%   enhanced_frame: 增强后的语音帧
%   noise_psd: 更新的噪声功率谱

% 窗函数
win = hamming(length(noisy_frame));
x_win = noisy_frame .* win;

% FFT
X = fft(x_win);
X_mag = abs(X);
X_phase = angle(X);

% 更新噪声谱估计
if isempty(noise_psd)
    noise_psd = X_mag.^2;
else
    noise_psd = alpha * noise_psd + (1-alpha) * (X_mag.^2);
end

% 谱减
enhanced_mag = X_mag.^2 - beta * noise_psd;
enhanced_mag(enhanced_mag < 0) = 0;  % 半波整流
enhanced_mag = sqrt(enhanced_mag);

% 重建信号
enhanced_spec = enhanced_mag .* exp(1j * X_phase);
enhanced_frame = real(ifft(enhanced_spec));

% 去除窗效应
enhanced_frame = enhanced_frame ./ (win + eps);
end

2.4 自动增益控制（rms_agc.m）

matlab 复制代码

function [agc_frame, gain] = rms_agc(input_frame, target_rms, attack_time, release_time, max_gain, min_gain, prev_gain)
% RMS自动增益控制
% 输入:
%   input_frame: 输入帧
%   target_rms: 目标RMS电平
%   attack_time: 攻击时间（秒）
%   release_time: 释放时间（秒）
%   max_gain: 最大增益
%   min_gain: 最小增益
%   prev_gain: 前一帧增益
% 输出:
%   agc_frame: AGC处理后的帧
%   gain: 当前增益

% 计算当前帧RMS
current_rms = rms(input_frame);

% 避免除零
if current_rms < 1e-10
    gain = prev_gain;
    agc_frame = input_frame * gain;
    return;
end

% 计算所需增益
desired_gain = target_rms / current_rms;

% 限制增益范围
desired_gain = max(min(desired_gain, max_gain), min_gain);

% 平滑增益变化（一阶低通滤波）
alpha_attack = 1 - exp(-1/(attack_time*16000));   % 攻击系数
alpha_release = 1 - exp(-1/(release_time*16000)); % 释放系数

if desired_gain > prev_gain
    % 增益增加（释放）
    gain = alpha_release * desired_gain + (1-alpha_release) * prev_gain;
else
    % 增益减小（攻击）
    gain = alpha_attack * desired_gain + (1-alpha_attack) * prev_gain;
end

% 应用增益
agc_frame = input_frame * gain;
end

2.5 性能评估函数（evaluate_performance.m）

matlab 复制代码

function evaluate_performance(original, processed, reference, fs)
% 性能评估函数
% 输入:
%   original: 原始含噪信号
%   processed: 处理后信号
%   reference: 纯净参考信号
%   fs: 采样率

% 1. 信噪比改善
snr_before = 10*log10(var(reference)/var(original-reference));
snr_after = 10*log10(var(reference)/var(processed-reference));
snr_improvement = snr_after - snr_before;

% 2. 分段信噪比
[pesq_mos, pesq_score] = pesq_eval(reference, processed, fs);

% 3. 频谱分析
figure('Position', [200, 200, 1000, 400]);

subplot(1,2,1);
[pxx_orig, f] = pwelch(original, 1024, [], [], fs);
[pxx_proc, ~] = pwelch(processed, 1024, [], [], fs);
semilogy(f, pxx_orig, 'b', 'LineWidth', 1.5); hold on;
semilogy(f, pxx_proc, 'r', 'LineWidth', 1.5);
xlabel('Frequency (Hz)');
ylabel('Power Spectral Density');
title('频谱对比');
legend('原始信号', '处理后信号');
grid on;

subplot(1,2,2);
% 时域对比
t = (0:length(reference)-1)/fs;
plot(t, reference, 'g', 'LineWidth', 1.5); hold on;
plot(t, processed(1:length(reference)), 'r--', 'LineWidth', 1.5);
xlabel('Time (s)');
ylabel('Amplitude');
title('时域对比');
legend('纯净语音', '处理后语音');
grid on;

% 显示性能指标
annotation('textbox', [0.15, 0.02, 0.7, 0.1], ...
    'String', sprintf(['SNR改善: %.2f dB | PESQ得分: %.3f | 处理增益: %.2f dB'], ...
    snr_improvement, pesq_score, 20*log10(rms(processed)/rms(original))), ...
    'FitBoxToText', 'on', 'BackgroundColor', 'yellow');

fprintf('=== 性能评估结果 ===\n');
fprintf('处理前SNR: %.2f dB\n', snr_before);
fprintf('处理后SNR: %.2f dB\n', snr_after);
fprintf('SNR改善: %.2f dB\n', snr_improvement);
fprintf('PESQ得分: %.3f\n', pesq_score);
end

2.6 PESQ评估函数（pesq_eval.m）

matlab 复制代码

function [mos, score] = pesq_eval(reference, degraded, fs)
% 简化版PESQ评估（实际应使用ITU-T P.862标准）
% 输入:
%   reference: 参考信号
%   degraded: 退化信号
%   fs: 采样率
% 输出:
%   mos: MOS评分（1-5分）
%   score: PESQ原始得分（-0.5到4.5）

% 重采样到8kHz（PESQ标准采样率）
if fs ~= 8000
    reference = resample(reference, 8000, fs);
    degraded = resample(degraded, 8000, fs);
end

% 对齐长度
min_len = min(length(reference), length(degraded));
reference = reference(1:min_len);
degraded = degraded(1:min_len);

% 计算时域误差
error = reference - degraded;

% 计算加权信噪比（简化模型）
snr = 10*log10(var(reference)/var(error));

% 转换为PESQ得分
score = max(min(4.5, 0.999 + 0.5*snr/20), -0.5);

% 转换为MOS评分
mos = 1 + 4/(1+exp(-1.5*(score-2.5)));
end

参考代码回声抵消噪声抑制、自动增益控制算法源代码 www.youwenfan.com/contentcsu/56240.html

三、算法优化与扩展

3.1 高级AEC算法（APA-AEC）

matlab 复制代码

function [error_signal, weights] = apa_aec(mic_frame, far_frame, weights, mu, order)
% 仿射投影算法（APA）AEC
% 比NLMS收敛更快，计算量更大

L = length(weights);
N = length(mic_frame);
K = order;  % 投影阶数

% 构造输入矩阵
X = zeros(L, K);
for k = 1:K
    X(:,k) = far_frame(N-k+1:-1:N-k-L+2);
end

% APA更新
delta = 1e-6;
E = mic_frame(N:-1:N-K+1) - weights' * X;
weights = weights + mu * X * ((X'*X + delta*eye(K)) \ E);

error_signal = mic_frame - weights' * X(:,1);
end

3.2 维纳滤波噪声抑制

matlab 复制代码

function enhanced_frame = wiener_filter(noisy_frame, noise_psd)
% 维纳滤波噪声抑制
% 优于谱减法，不会产生音乐噪声

win = hamming(length(noisy_frame));
x_win = noisy_frame .* win;

X = fft(x_win);
X_mag = abs(X);
X_phase = angle(X);

% 维纳增益
gain = X_mag.^2 ./ (X_mag.^2 + noise_psd + eps);

% 应用增益
enhanced_spec = gain .* X_mag .* exp(1j * X_phase);
enhanced_frame = real(ifft(enhanced_spec)) ./ (win + eps);
end

3.3 双讲检测（DTD）

matlab 复制代码

function is_double_talk = double_talk_detector(mic_frame, far_frame, weights)
% 双讲检测器
% 当近端和远端同时说话时，暂停AEC更新

% 计算回声消除后的残余回声
echo_residual = mic_frame - filter(weights, 1, far_frame);

% 计算能量比
mic_energy = var(mic_frame);
residual_energy = var(echo_residual);

% 双讲检测准则
ratio = residual_energy / (mic_energy + eps);
is_double_talk = ratio > 0.7;  % 阈值可调
end

四、实时部署建议

4.1 MATLAB Coder 代码生成

matlab 复制代码

% 生成C代码用于嵌入式部署
cfg = coder.config('lib');
cfg.TargetLang = 'C';
cfg.GenerateReport = true;

% 定义输入类型
input_args = {zeros(256,1), zeros(256,1), zeros(1024,1)};

% 生成代码
codegen -config cfg nlms_aec -args input_args

4.2 参数调优指南

算法	参数	推荐值	调整建议
AEC	μ (步长)	0.1-0.5	收敛慢→增大，不稳定→减小
AEC	滤波器长度	512-2048	回声路径长→增大
NS	β (过减因子)	0.05-0.3	噪声大→增大，语音失真→减小
AGC	攻击时间	5-20ms	防止突变→减小
AGC	释放时间	50-200ms	避免呼吸效应→增大

4.3 常见问题解决

现象	原因	解决方案
回声消除不彻底	滤波器长度不足	增加AEC滤波器长度
语音失真严重	步长过大/过减因子过大	减小μ和β参数
音乐噪声	谱减法缺陷	改用维纳滤波
双讲时发散	缺乏双讲检测	添加DTD模块
计算量过大	帧长/滤波器过长	优化算法或降低采样率

五、总结

这套MATLAB实现提供了完整的 AEC + NS + AGC 解决方案：

回声抵消 ：NLMS自适应滤波，有效消除声学回声
噪声抑制 ：谱减法+维纳滤波，双重降噪保障
自动增益 ：RMS电平控制，音量自动平衡
实时可视化 ：逐帧显示处理效果
性能评估：SNR改善、PESQ评分量化分析

应用场景：

视频会议系统
车载免提通话
智能音箱语音交互
助听器音频处理
VoIP语音通信