音频筑基:入门50问

音频筑基:入门50问

只问不答,意在启发。

通用类

  1. 为什么音频信号分析要从时域到频域?
  2. 频域变换中,为啥要做TDAC时域混叠消除?
  3. 人耳听觉频域敏感区是哪部分,为什么?
  4. 人声发声频域重要区域是哪部分及为什么?
  5. 乐声、人声常见频率段为?
  6. 人耳听觉频段高频、中频、低频通常范围是指?
  7. 什么是窗函数,为什么要加窗函数?
  8. 为什么要用傅里叶变换?
  9. 为什么会从DFT到FFT?
  10. 为什么频域编解码多用DCT或MDCT?
  11. 梅尔谱和梅尔倒谱系数MFCC啥关系?
  12. 梅尔谱系数(MFCC)和巴克谱系数(BFCC)的区别是?
  13. 音频技术中,单词voice和speech有何分别?
  14. 语音序列中通常含有哪些信息?提示:情绪、病理、说话人特征
  15. 音频里的3A和图像里的3A分别是指?
  16. PCM量化中,ulaw和alaw的区别是?
  17. 音频中bit位深大于24位以上,意义是啥?
  18. 什么是互调失真IMD?
  19. 音频信号中过零率有啥物理含义表征?有啥主观感受,如何感性理解?
  20. 听音评测中,羊耳和亚耳有啥区别?
  21. 信噪比计算公式是?
  22. 上采样下采样是啥?
  23. 上混下混是啥?
  24. 什么是总谐波失真+噪声(THD+N)?

编解码类

  1. 英文codec单词的来历是?
  2. 编解码分类有哪些?
  3. 常见语音编解码架构是什么?
  4. 编解码核心技术模块有哪些?为什么?
  5. 如果你入手,第一个想研究什么?
  6. 你对当前项目的认识有哪些?从进展、难点、重点多方面分析
  7. 频域编解码的核心问题是什么?
  8. 当前编解码的问题在哪儿?
  9. 哪种范数适用于音频编解码里的损失评估?
  10. 为啥编解码器中通常只标准化解码器,不标准化编码器?
  11. 语音编解码和音乐编解码的本质区别有哪些?
  12. 什么是预回声?
  13. 预加重滤波的目的是啥?
  14. 斜滤波器处理原因为何?

部分问题参考:

  1. 什么是窗函数?为啥要加窗函数?https://zhuanlan.zhihu.com/p/24318554
相关推荐
wen_zhufeng44 分钟前
信号与系统:采样、量化与信号连续/离散答疑文档
音视频
byte轻骑兵2 小时前
【LE Audio】CAS精讲[1]: 基础约定定乾坤,读懂音频协同的通用规则
音视频·蓝牙耳机·蓝牙音箱·le audio·低功耗音频
肖爱Kun3 小时前
STL标准模块库操作
开发语言·音视频
2601_958352903 小时前
双麦 DSP 音频拾音模块 A-68:多场景远场语音交互的声学解决方案
嵌入式硬件·音视频·降噪·回音消除·音频处理模块
2601_958352905 小时前
对讲系统音频优化实战:解决回声、啸叫、环境噪音与远场拾音难题
嵌入式硬件·音视频·语音识别·降噪处理·音频处理模块·硬件开发模块
南山有乔木7895 小时前
下载的ncm歌曲不能播放怎么办?NCM在线转MP3怎么操作?手机电脑转换教程参考
音视频
开开心心就好6 小时前
解决截图被拦截黑屏问题的免费小工具
安全·智能手机·flink·kafka·pdf·音视频·1024程序员节
2601_958352906 小时前
双麦 DSP 音频模块实战:一文梳理 A-68 在全行业场景的声学解决方案与落地要点
前端·嵌入式硬件·音视频·语音识别·降噪消回音·音频处理模块
Deitymoon7 小时前
RV1126——OSD模块和SDL_TTF结合输出H264文件
计算机视觉·音视频·rv1126·osd
AI创界者7 小时前
【解压即用】Scail-2 视频动作迁移一键整合包:8G显存通吃50系,长视频/多人/精准目标替换全攻略
人工智能·python·aigc·音视频