如何正确处理音频数据:16位整数与32位浮点数

在音频处理领域,音频数据的格式对后续的分析和处理至关重要。常见的音频格式包括16位整数和32位浮点数。本文将介绍如何正确处理这两种格式的音频数据,包括使用 scipy.io.wavfile 读取音频、使用 librosa 进行处理,以及使用 soundfilesf)写入音频文件。

1. 16位整数音频

1.1 读取音频

16位整数音频通常以 int16 格式存储。使用 scipy.io.wavfile 读取音频文件时,返回的数据类型为 numpy.int16

python 复制代码
import numpy as np
from scipy.io import wavfile

# 读取 WAV 文件
sample_rate, audio_data = wavfile.read('your_audio_file_16bit.wav')

# 打印数据类型和范围
print(f'Data type: {audio_data.dtype}')
print(f'Data range: {audio_data.min()} to {audio_data.max()}')

1.2 处理音频

在使用 librosa 处理音频数据之前,需要将16位整数数据转换为浮点数格式,并归一化到 -1, 1 的范围。

python 复制代码
import librosa

# 如果数据是整数格式(例如 int16),则需要归一化
if audio_data.dtype == np.int16:
    audio_data = audio_data.astype(np.float32) / 32768.0  # 归一化到 [-1, 1]

# 使用 librosa 进行处理
audio_data_processed = librosa.effects.preemphasis(audio_data)

1.3 写入音频

使用 soundfile 库将处理后的音频数据写入文件时,需要将浮点数数据转换回16位整数格式(如果需要)。

python 复制代码
import soundfile as sf

# 将浮点数数据转换为 int16
audio_data_int16 = (audio_data_processed * 32768).astype(np.int16)

# 写入 WAV 文件
sf.write('output_16bit.wav', audio_data_int16, sample_rate)

2. 32位浮点音频

2.1 读取音频

32位浮点音频通常以 float32 格式存储。使用 scipy.io.wavfile 读取音频文件时,返回的数据类型为 numpy.float32

python 复制代码
# 读取 WAV 文件
sample_rate, audio_data = wavfile.read('your_audio_file_32bit.wav')

# 打印数据类型和范围
print(f'Data type: {audio_data.dtype}')
print(f'Data range: {audio_data.min()} to {audio_data.max()}')

2.2 处理音频

32位浮点音频数据通常已经在 -1, 1 的范围内,因此可以直接使用 librosa 进行处理。

python 复制代码
# 使用 librosa 进行处理
audio_data_processed = librosa.effects.preemphasis(audio_data)

2.3 写入音频

使用 soundfile 库将处理后的音频数据写入文件时,可以直接写入浮点数数据。

python 复制代码
# 写入 WAV 文件
sf.write('output_32bit.wav', audio_data_processed, sample_rate)
相关推荐
小鹿研究点东西5 小时前
AI直播工具实操:从直播录制、AI剪辑去重到直播伴侣开播完整流程
人工智能·自动化·音视频·语音识别
wen_zhufeng6 小时前
信号与系统:采样、量化与信号连续/离散答疑文档
音视频
byte轻骑兵7 小时前
【LE Audio】CAS精讲[1]: 基础约定定乾坤,读懂音频协同的通用规则
音视频·蓝牙耳机·蓝牙音箱·le audio·低功耗音频
肖爱Kun9 小时前
STL标准模块库操作
开发语言·音视频
2601_958352909 小时前
双麦 DSP 音频拾音模块 A-68:多场景远场语音交互的声学解决方案
嵌入式硬件·音视频·降噪·回音消除·音频处理模块
2601_9583529011 小时前
对讲系统音频优化实战:解决回声、啸叫、环境噪音与远场拾音难题
嵌入式硬件·音视频·语音识别·降噪处理·音频处理模块·硬件开发模块
南山有乔木78911 小时前
下载的ncm歌曲不能播放怎么办?NCM在线转MP3怎么操作?手机电脑转换教程参考
音视频
开开心心就好12 小时前
解决截图被拦截黑屏问题的免费小工具
安全·智能手机·flink·kafka·pdf·音视频·1024程序员节
2601_9583529012 小时前
双麦 DSP 音频模块实战:一文梳理 A-68 在全行业场景的声学解决方案与落地要点
前端·嵌入式硬件·音视频·语音识别·降噪消回音·音频处理模块
Deitymoon13 小时前
RV1126——OSD模块和SDL_TTF结合输出H264文件
计算机视觉·音视频·rv1126·osd