音频采样数据格式

音频信号在模拟到数字转换时,会涉及到多个关键参数,如采样率、位深度、通道数等。下面是常见的音频采样数据格式及其相关概念:

1. 采样率 (Sample Rate)

采样率指的是每秒钟对音频信号进行采样的次数,单位为赫兹 (Hz)。常见的值如下:

  • 44.1 kHz:常用于音频CD和大多数音乐文件格式(如WAV、MP3)。
  • 48 kHz:常用于专业音频录制、电影和视频音频处理。
  • 96 kHz、192 kHz:常用于高保真音频(Hi-Fi)或专业录音应用。

为了能够准确地重现模拟音频信号中的所有频率,采样率必须遵循 奈奎斯特定理(Nyquist Theorem),即采样率必须至少是信号中最高频率的两倍。这是因为我们只能重建出采样频率以下的信号,超过采样频率一半的信号(即奈奎斯特频率)会出现混叠现象,导致音频失真。

44.1 kH采样率的由来

早期的数码录音就是一个PCM编码器加录像机,所以,数据音频信号是在录像机(录像带)中存储的。PAL制式的录像机每帧有625条扫描线,但实际可用的扫描线为588条,由于隔行扫描,扫描线减半,就成了294条。每条扫描线可以存储3个采样点的信息,场频为50Hz,因而采样点数量为294×50×3 = 44 100。

2. 位深度 (Bit Depth)

位深度指的是每个采样点的数值精度,即每个采样值所用的比特数。常见的值如下:

  • 16位:用于CD音质(动态范围为96 dB)。
  • 24位:用于高质量录音和制作,通常用于专业音频处理。
  • 32位浮动:用于数字音频处理软件中的浮动点格式,提供极高的动态范围。

3. 通道数 (Channels)

指的音频信号中的声道数。如下图,当我们坐在中间时,不同声道的声音让我们感觉它们来自不同的方向。

相关推荐
REDcker1 天前
WebCodecs VideoDecoder 的 hardwareAcceleration 使用
前端·音视频·实时音视频·直播·webcodecs·videodecoder
gihigo19981 天前
基于TCP协议实现视频采集与通信
网络协议·tcp/ip·音视频
山河君1 天前
四麦克风声源定位实战:基于 GCC-PHAT + 最小二乘法实现 DOA
算法·音视频·语音识别·信号处理·最小二乘法·tdoa
音视频牛哥1 天前
Android平台RTMP/RTSP超低延迟直播播放器开发详解——基于SmartMediaKit深度实践
android·人工智能·计算机视觉·音视频·rtmp播放器·安卓rtmp播放器·rtmp直播播放器
qq_416276421 天前
通用音频表征的对比学习
学习·音视频
美狐美颜sdk1 天前
Android全局美颜sdk实现方案详解
人工智能·音视频·美颜sdk·视频美颜sdk·美狐美颜sdk
EasyDSS1 天前
私有化部署EasyDSS视频点播能力:全链路视频技术赋能,打造企业级视听新体验
音视频·hls·m3u8·点播技术·智能转码
qq_416276421 天前
DeLoRes——一种通用的音频表征学习新方法(DeLoRes(基于 Barlow Twins 的冗余最小化方法)
学习·音视频
Q_4582838681 天前
从定位到视频:808 + 1078 在各行业的落地实践
音视频
山顶望月川1 天前
实测MiniMax-Hailuo-02:当“开工大吉“变成“无字天书“,国产AI视频模型的能与之不能
人工智能·音视频