不同音频振幅dBFS计算方法

1. 振幅的基本概念

振幅是描述音频信号强度的一个重要参数。它通常表示为信号的幅度值,幅度越大,声音听起来就越响。为了更好地理解和处理音频信号,通常会将振幅转换为分贝(dB)单位。分贝是一个对数单位,能够更好地反映人耳对声音强度变化的感知。

2. 振幅计算方法

2.1 总 RMS(Total RMS)

总 RMS 是一种常用的振幅计算方法,表示整个音频信号的平均能量。其计算公式为:
RMS = 20 ⋅ log ⁡ 10 ( 1 N ∑ i = 1 N x i 2 + 1.0 × 1 0 − 9 ) \text{RMS} = 20 \cdot \log_{10}(\sqrt{\frac{1}{N} \sum_{i=1}^{N} x_i^2} + 1.0 \times 10^{-9}) RMS=20⋅log10(N1i=1∑Nxi2 +1.0×10−9)

其中, x i x_i xi是音频信号的样本值, N N N 是样本总数。总 RMS 提供了音频信号的整体响度感知。

2.2 最大 RMS(Max RMS)

最大 RMS 是通过将音频信号分成多个窗口,计算每个窗口的 RMS 值,并返回这些值中的最大值。其计算公式为:
Max RMS = max ⁡ ( 20 ⋅ log ⁡ 10 ( 1 N ∑ i = 1 N x i 2 + 1.0 × 1 0 − 9 ) ) \text{Max RMS} = \max \left( 20 \cdot \log_{10} \left( \sqrt{\frac{1}{N} \sum_{i=1}^{N} x_i^2} + 1.0 \times 10^{-9} \right) \right) Max RMS=max 20⋅log10 N1i=1∑Nxi2 +1.0×10−9

其中:

  • x i x_i xi 是窗口内的音频样本值。
  • N N N是窗口内样本的总数。

2.3 最小 RMS(Min RMS)

最小 RMS 与最大 RMS 类似,但它返回的是每个窗口中计算出的最小 RMS 值。其计算公式为:
Min RMS = min ⁡ ( 20 ⋅ log ⁡ 10 ( 1 N ∑ i = 1 N x i 2 + 1.0 × 1 0 − 9 ) ) \text{Min RMS} = \min \left( 20 \cdot \log_{10} \left( \sqrt{\frac{1}{N} \sum_{i=1}^{N} x_i^2} + 1.0 \times 10^{-9} \right) \right) Min RMS=min 20⋅log10 N1i=1∑Nxi2 +1.0×10−9

其中:

  • x i x_i xi 是窗口内的音频样本值。
  • N N N 是窗口内样本的总数。

2.4 平均 RMS(Avg RMS)

平均 RMS 是所有窗口 RMS 值的平均值,提供了音频信号的整体响度水平。其计算公式为:
Avg RMS = 1 M ∑ j = 1 M ( 20 ⋅ log ⁡ 10 ( 1 N ∑ i = 1 N x i j 2 + 1.0 × 1 0 − 9 ) ) \text{Avg RMS} = \frac{1}{M} \sum_{j=1}^{M} \left( 20 \cdot \log_{10} \left( \sqrt{\frac{1}{N} \sum_{i=1}^{N} x_{ij}^2} + 1.0 \times 10^{-9} \right) \right) Avg RMS=M1j=1∑M 20⋅log10 N1i=1∑Nxij2 +1.0×10−9

其中:

  • x i j x_{ij} xij 是第 j j j 个窗口内的音频样本值。
  • N N N 是每个窗口内样本的总数。
  • M M M 是窗口的总数。

2.5 峰值幅度(Peak Amplitude)

峰值幅度是音频信号中最大绝对值的幅度,通常用于表示信号的瞬时强度。其计算公式为:
Peak = 20 ⋅ log ⁡ 10 ( max ⁡ ( ∣ x ∣ ) + 1.0 × 1 0 − 9 ) \text{Peak} = 20 \cdot \log_{10}(\max(|x|) + 1.0 \times 10^{-9}) Peak=20⋅log10(max(∣x∣)+1.0×10−9)

峰值幅度能够快速反映音频信号的瞬时响度,但不一定能准确表示人耳的感知。

3. 听觉结果的一致性

人耳对声音的感知是非线性的,通常对响度变化的感知与实际的物理振幅变化不成正比。使用 RMS 和分贝单位进行计算,可以更好地模拟人耳的感知特性。以下是不同计算方法与听觉结果的一致性分析:

  • 总 RMS:提供了整体响度的良好估计,通常与听觉感知一致。
  • 最大 RMS:能够捕捉到音频信号中的最强响度部分,适合用于动态范围分析。
  • 最小 RMS:有助于识别音频信号中的弱响度部分,适合用于音频修复和增强。
  • 平均 RMS:提供了稳定的响度水平,适合用于音频混音和母带处理。
  • 峰值幅度:虽然能够快速反映瞬时响度,但由于其瞬时特性,可能与人耳的感知不完全一致。

4. 程序实现

python 复制代码
import os
import numpy as np
import librosa
def calculate_total_rms_dbfs(audio_data):
    rms_level = 20 * np.log10(np.sqrt(np.mean(audio_data ** 2)) + 1.0e-9)  # 计算总 RMS 并转换为 dBFS
    return rms_level
def calculate_max_rms_dbfs(audio_data, window_size):
    rms_values = []
    for start in range(0, len(audio_data), window_size):
        end = min(start + window_size, len(audio_data))
        window = audio_data[start:end]
        if len(window) > 0:
            rms = 20 * np.log10(np.sqrt(np.mean(window ** 2)) + 1.0e-9)
            rms_values.append(rms)
    return np.max(rms_values) if rms_values else -np.inf  # 返回 -inf 如果没有 RMS 值
def calculate_min_rms_dbfs(audio_data, window_size):
    rms_values = []
    for start in range(0, len(audio_data), window_size):
        end = min(start + window_size, len(audio_data))
        window = audio_data[start:end]
        if len(window) > 0:
            rms = 20 * np.log10(np.sqrt(np.mean(window ** 2)) + 1.0e-9)
            rms_values.append(rms)
    return np.min(rms_values) if rms_values else -np.inf  # 返回 -inf 如果没有 RMS 值
def calculate_avg_rms_dbfs(audio_data, window_size):
    rms_values = []
    for start in range(0, len(audio_data), window_size):
        end = min(start + window_size, len(audio_data))
        window = audio_data[start:end]
        if len(window) > 0:
            rms = 20 * np.log10(np.sqrt(np.mean(window ** 2)) + 1.0e-9)
            rms_values.append(rms)
    return np.mean(rms_values) if rms_values else -np.inf  # 返回 -inf 如果没有 RMS 值
def calculate_peak_amplitude(audio_data):
    return 20 * np.log10(np.max(np.abs(audio_data)) + 1.0e-9)
def analyze_audio_file(audio_path, window_duration=0.05):
    audio_data, sr = librosa.load(audio_path, sr=None)
    window_size = int(window_duration * sr)
    total_rms_dbfs = calculate_total_rms_dbfs(audio_data)
    max_rms_dbfs = calculate_max_rms_dbfs(audio_data, window_size)
    min_rms_dbfs = calculate_min_rms_dbfs(audio_data, window_size)
    avg_rms_dbfs = calculate_avg_rms_dbfs(audio_data, window_size)
    peak_amplitude = calculate_peak_amplitude(audio_data)
    print(f"File: {audio_path}")
    print(f"Total RMS (dBFS): {total_rms_dbfs:.2f}")
    print(f"Max RMS (dBFS): {max_rms_dbfs:.2f}")
    print(f"Min RMS (dBFS): {min_rms_dbfs:.2f}")
    print(f"Avg RMS (dBFS): {avg_rms_dbfs:.2f}")
    print(f"Peak Amplitude(dBFS): {peak_amplitude:.2f}")
if __name__ == "__main__":
    audio_path = '/Volumes/T9/DATA/构建数据集/SELE/real_echo/0011217_echo.wav'
    analyze_audio_file(audio_path)

计算结果与Audition一致。

相关推荐
2601_9583529021 小时前
A-59双麦模块实战:打造面对面双人独立拾音与实时翻译系统,全双工无串扰
人工智能·嵌入式硬件·语音识别·回音消除·音频处理模块
小鹿软件办公1 天前
微软发布旗下首款具备思考能力的 MAI-Thinking-1 AI 模型
人工智能·microsoft·语音识别
foundbug9991 天前
STM32 简单语音识别实现方案(开灯关灯拨打电话)
stm32·嵌入式硬件·语音识别
J心流1 天前
X-ASR 把本地语音输入的底座拼出来了
语音识别
俊基科技1 天前
矿用对讲降噪改造实战|A-68 语音模块解决井下高噪回音、啸叫难题
嵌入式硬件·语音识别·ai降噪·回声消除·矿用通信·语音 dsp
piao9618272 天前
企业级AIOT方案落地实践:2026年线下销售过程管理AI硬件推荐
人工智能·语音识别
szxinmai主板定制专家2 天前
基于 ARM+FPGA精密多轴实时运动控制卡设计方案,适用于半导体设备等高精度领域(一)
arm开发·人工智能·嵌入式硬件·fpga开发·架构·语音识别
高兴高兴张高兴2 天前
张高兴的 Hailo-10 开发指南:(一)实现离线语音识别
人工智能·语音识别
古方路杰出青年2 天前
学习笔记:语音信号读取与显示——理论分析与技术详解(含代码块)
笔记·学习·语音识别
searchforAI2 天前
Ai好记 vs Get笔记:AI音视频笔记工具深度测评对比
人工智能·笔记·学习·ai·音视频·语音识别