基于MATLAB实现传统谱减法以及两种改进的谱减法(增益函数谱减法、多带谱减法)的语音增强

基于MATLAB实现传统谱减法以及两种改进的谱减法(增益函数谱减法、多带谱减法)的语音增强代码示例:

传统谱减法

matlab 复制代码
function enhanced = traditional_spectral_subtraction(noisy, fs, wlen, inc, NIS, a, b)
    % 参数说明:
    % noisy - 带噪语音信号
    % fs - 采样频率
    % wlen - 帧长
    % inc - 帧移
    % NIS - 前导无话段帧数
    % a - 过减因子
    % b - 增益补偿因子

    % 计算噪声功率谱
    noise_frames = buffer(noisy(1:NIS*inc), wlen, wlen-inc);
    noise_frames = noise_frames(:, 1:NIS);
    noise_power = mean(abs(fft(noise_frames)).^2, 2);

    % 分帧
    frames = buffer(noisy, wlen, wlen-inc);
    num_frames = size(frames, 2);

    % 初始化增强后的语音
    enhanced = zeros(size(noisy));

    % 谱减法处理
    for i = 1:num_frames
        % FFT
        X = fft(frames(:, i));
        X_mag = abs(X);
        X_phase = angle(X);

        % 谱减法
        S_mag = max(X_mag - a * sqrt(noise_power), b * sqrt(noise_power));

        % 逆FFT
        S = S_mag .* exp(1j * X_phase);
        enhanced_frame = real(ifft(S));

        % 重叠相加
        enhanced((i-1)*inc+1:(i-1)*inc+wlen) = enhanced((i-1)*inc+1:(i-1)*inc+wlen) + enhanced_frame;
    end
end

增益函数谱减法

matlab 复制代码
function enhanced = gain_function_spectral_subtraction(noisy, fs, wlen, inc, NIS, alpha, beta)
    % 参数说明:
    % noisy - 带噪语音信号
    % fs - 采样频率
    % wlen - 帧长
    % inc - 帧移
    % NIS - 前导无话段帧数
    % alpha - 过减因子
    % beta - 增益补偿因子

    % 计算噪声功率谱
    noise_frames = buffer(noisy(1:NIS*inc), wlen, wlen-inc);
    noise_frames = noise_frames(:, 1:NIS);
    noise_power = mean(abs(fft(noise_frames)).^2, 2);

    % 分帧
    frames = buffer(noisy, wlen, wlen-inc);
    num_frames = size(frames, 2);

    % 初始化增强后的语音
    enhanced = zeros(size(noisy));

    % 谱减法处理
    for i = 1:num_frames
        % FFT
        X = fft(frames(:, i));
        X_mag = abs(X);
        X_phase = angle(X);

        % 增益函数
        G = (X_mag - alpha * sqrt(noise_power)) ./ X_mag;
        G = max(G, beta);

        % 增强后的频谱
        S_mag = G .* X_mag;

        % 逆FFT
        S = S_mag .* exp(1j * X_phase);
        enhanced_frame = real(ifft(S));

        % 重叠相加
        enhanced((i-1)*inc+1:(i-1)*inc+wlen) = enhanced((i-1)*inc+1:(i-1)*inc+wlen) + enhanced_frame;
    end
end

多带谱减法

matlab 复制代码
function enhanced = multiband_spectral_subtraction(noisy, fs, wlen, inc, NIS, num_bands)
    % 参数说明:
    % noisy - 带噪语音信号
    % fs - 采样频率
    % wlen - 帧长
    % inc - 帧移
    % NIS - 前导无话段帧数
    % num_bands - 子带数量

    % 计算噪声功率谱
    noise_frames = buffer(noisy(1:NIS*inc), wlen, wlen-inc);
    noise_frames = noise_frames(:, 1:NIS);
    noise_power = mean(abs(fft(noise_frames)).^2, 2);

    % 分帧
    frames = buffer(noisy, wlen, wlen-inc);
    num_frames = size(frames, 2);

    % 初始化增强后的语音
    enhanced = zeros(size(noisy));

    % 子带划分
    band_width = wlen / num_bands;

    % 谱减法处理
    for i = 1:num_frames
        % FFT
        X = fft(frames(:, i));
        X_mag = abs(X);
        X_phase = angle(X);

        % 多带谱减法
        S_mag = zeros(size(X_mag));
        for j = 1:num_bands
            band_start = (j-1) * band_width + 1;
            band_end = j * band_width;
            band_noise_power = noise_power(band_start:band_end);
            S_mag(band_start:band_end) = max(X_mag(band_start:band_end) - band_noise_power, 0);
        end

        % 逆FFT
        S = S_mag .* exp(1j * X_phase);
        enhanced_frame = real(ifft(S));

        % 重叠相加
        enhanced((i-1)*inc+1:(i-1)*inc+wlen) = enhanced((i-1)*inc+1:(i-1)*inc+wlen) + enhanced_frame;
    end
end

使用示例

matlab 复制代码
% 读取带噪语音信号
[noisy, fs] = audioread('noisy_speech.wav');

% 参数设置
wlen = 256; % 帧长
inc = 128; % 帧移
NIS = 10; % 前导无话段帧数
a = 4; % 过减因子
b = 0.001; % 增益补偿因子
alpha = 4; % 增益函数过减因子
beta = 0.001; % 增益函数增益补偿因子
num_bands = 4; % 多带谱减法子带数量

% 传统谱减法
enhanced_traditional = traditional_spectral_subtraction(noisy, fs, wlen, inc, NIS, a, b);

% 增益函数谱减法
enhanced_gain_function = gain_function_spectral_subtraction(noisy, fs, wlen, inc, NIS, alpha, beta);

% 多带谱减法
enhanced_multiband = multiband_spectral_subtraction(noisy, fs, wlen, inc, NIS, num_bands);

% 保存增强后的语音
audiowrite('enhanced_traditional.wav', enhanced_traditional, fs);
audiowrite('enhanced_gain_function.wav', enhanced_gain_function, fs);
audiowrite('enhanced_multiband.wav', enhanced_multiband, fs);

说明

  • 传统谱减法:直接从带噪语音频谱中减去噪声功率谱,可能会导致"音乐噪声"问题。
  • 增益函数谱减法:通过引入增益函数来平滑频谱,减少"音乐噪声"。
  • 多带谱减法:将语音频谱划分为多个子带进行独立处理,减少"音乐噪声"的影响。

你可以根据实际需求调整参数,以获得更好的语音增强效果。

相关推荐
眠修2 分钟前
Kuberrnetes 服务发布
linux·运维·服务器
重庆小透明7 分钟前
力扣刷题记录【1】146.LRU缓存
java·后端·学习·算法·leetcode·缓存
lang2015092812 分钟前
Reactor操作符的共享与复用
java
TTc_23 分钟前
@Transactional事务注解的批量回滚机制
java·事务
wei_shuo1 小时前
飞算 JavaAI 开发助手:深度学习驱动下的 Java 全链路智能开发新范式
java·开发语言·飞算javaai
BAOYUCompany1 小时前
暴雨服务器成功中标华中科技大学集成电路学院服务器采购项目
运维·服务器
欧阳秦穆2 小时前
apoc-5.24.0-extended.jar 和 apoc-4.4.0.36-all.jar 啥区别
java·jar
岁忧2 小时前
(LeetCode 面试经典 150 题 ) 58. 最后一个单词的长度 (字符串)
java·c++·算法·leetcode·面试·go
Java初学者小白2 小时前
秋招Day14 - Redis - 应用
java·数据库·redis·缓存
代码老y2 小时前
Spring Boot + 本地部署大模型实现:优化与性能提升
java·spring boot·后端