音频AI降噪算法

噪声抑制

噪声抑制是语音处理中非常古老的话题,它主要的思想是在保证我们感兴趣的语音部分尽可能不被扭曲的前提下,将混合信号中的噪声尽可能消除。

今天我们主要介绍下AI降噪比较,AI降噪目前效果比较好的就属RNNoise算法模型了,我在实际应用过程中,对比过webrtc的降噪算法,在某些背景噪音比较大的情况下,webrtc的降噪算法效果就不是很好了,但是RNNnoise降噪效果还是比较不错的。

RNNoise

主要包括训练部分和降噪部分,它会先从语音和噪音语料里提取特征数据,再用这些数据训练,得到一个能把语音信号和噪声信号区分开来的模型,然后用得到的模型对输入的音频信号进行处理,在很多情况下都能得到良好的降噪效果。

RNNoise缺点:

虽然AI降噪比较牛,在某些情况下也降噪效果比普通降噪算法要好,但是缺点也比较明显,就是在噪音比较大的时候,有时会有损伤正常的音频,会有吞字的现象,这个就需要对算法进行针对性优化了。

以下是官网的代码,可做参考,亲测效果还可以,目前可以支持8k、16k、48k采样率的pcm数据。

ini 复制代码
int main(int argc, char **argv) {
  int i;
  int first = 1;
  float x[FRAME_SIZE];
  FILE *f1, *fout;
  DenoiseState *st;
  st = rnnoise_create(NULL);
  if (argc!=3) {
    fprintf(stderr, "usage: %s <noisy speech> <output denoised>\n", argv[0]);
    return 1;
  }
  f1 = fopen(argv[1], "rb");
  fout = fopen(argv[2], "wb");
  while (1) {
    short tmp[FRAME_SIZE];
    fread(tmp, sizeof(short), FRAME_SIZE, f1);
    if (feof(f1)) break;
    for (i=0;i<FRAME_SIZE;i++) x[i] = tmp[i];
    rnnoise_process_frame(st, x, x);
    for (i=0;i<FRAME_SIZE;i++) tmp[i] = x[i];
    if (!first) fwrite(tmp, sizeof(short), FRAME_SIZE, fout);
    first = 0;
  }
  rnnoise_destroy(st);
  fclose(f1);
  fclose(fout);
  return 0;
}

examples目录: ./rnnoise_demo sample.wav sample_out.wav

上面一行是未处理的原始音频数据,下面一行是噪音处理后的音频数据,处理的相对还是比较干净的。

目前这个算法可以应用到多种平台,像windows、linux、android、ios、arm平台都可以支持,我都做过测试,效果基本差别不大。

如果需要技术问题想要沟通、技术交流讨论、业务合作也非常欢迎。

联系方式:

vx:unique_no_1

tel:18108010758

相关推荐
LYFlied6 分钟前
【每日算法】LeetCode 105. 从前序与中序遍历序列构造二叉树
数据结构·算法·leetcode·面试·职场和发展
DanyHope12 分钟前
LeetCode 206. 反转链表:迭代 + 递归双解法全解析
算法·leetcode·链表·递归·迭代
NAGNIP15 分钟前
才发现TensorBoard是个可视化的神器!
算法
_dindong21 分钟前
算法杂谈:回溯路线
数据结构·算法·动态规划·bfs·宽度优先
咋吃都不胖lyh22 分钟前
详解 UCB 算法的置信区间与核心逻辑(通俗 + 公式 + 实例)
人工智能·算法·机器学习
DanyHope30 分钟前
LeetCode 两数之和:从 O (n²) 到 O (n),空间换时间的经典实践
前端·javascript·算法·leetcode·职场和发展
free-elcmacom36 分钟前
机器学习高阶教程<6>推荐系统高阶修炼手册:混排、多任务与在线学习,解锁精准推荐新境界
人工智能·python·学习·算法·机器学习·机器人
断剑zou天涯37 分钟前
【算法笔记】AC自动机
java·笔记·算法
IT猿手40 分钟前
基于粒子群算法与动态窗口混合的无人机三维动态避障路径规划研究,MATLAB代码
算法·matlab·无人机·多目标优化算法·多目标算法
民乐团扒谱机41 分钟前
【微实验】仿AU音频编辑器开发实践:从零构建音频可视化工具
算法·c#·仿真·audio·fft·频谱