音频重采样注意事项--软件层面

为什么要对音频重采样?

1.设备标准化:对于不同的设备 所需要的采样率不同,所以此时需要对原始音频重新采样

2.格式标准化:

复制代码
MP3: 通常 44.1 kHz
AAC: 多种采样率,但需要统一
视频容器: 通常要求固定采样率
直播流: 需要特定采样率以节省带宽

3.带宽与存储优化

复制代码
// 高保真音乐:保持高质量
目标采样率 = 48000 Hz  // 专业质量

// 语音通话:节省带宽  
目标采样率 = 16000 Hz  // 语音清晰且文件小

// 低带宽网络:进一步压缩
目标采样率 = 8000 Hz   // 基本可懂度
复制代码
原始音频: 48 kHz, 3分钟, 立体声 ≈ 33 MB
重采样后: 22.05 kHz, 3分钟, 立体声 ≈ 15 MB  // 节省50%空间!

4.音视频同步等等

如何对音频重采样

首先如果一个视频,我需要对里面的音频进行重采样 ,那么为了保证视频重采样后,视频依旧同步,那么需要保证 时间同步。 为了保证时间同步,那么最重要的就是原本视频的每一帧数据依旧对应上音频的每一帧数据,而一帧数据又有多个采样点。
所以我们可以推出以下公式

已知 原数据采样率 ,一帧数据有多少采样点,以及目标音频的采样率。
src_samples / src_sample_ratio = dst_samples / dst_sample_ratio

所以我们就可以推出 转换后一帧需要多少个采样点

dst_samples = ( src_samples / src_sample_ratio )*dst_sample_ratio

对于重采样分为两种

低频->高频 : 此时一帧需要的采样点数量会变多

高频->低配:此时一帧需要的采样点数量会少

那么 这时候可能会有两个问题

对于低频到高频 原数据的采样点根本就不够 高频需要的那么多个采样点?

这时候就需要对原本的数据进行信号重建

任何带宽受限的连续信号,都可以用离散样本完美重构,只要:

复制代码
采样频率 > 2 × 信号最高频率

通过重构的信号进行重新采样。

对于高频到低频 原数据的采样点有冗余 那么低频如何处理多出来的采样点?

高频输入 → 抗混叠低通滤波 → 抽取降采样 → 低频输出

但是还有一个问题对于pts(即显示时间戳,用于指示音频或视频帧应该在什么时候被呈现(播放)。在音视频同步中,PTS非常重要。) 为0的情况 ,我们可以通过以上公式算出固定的一帧的采样数

但是如果原始数据的pts 比如 为 10000的时候,此时计算显示时间 pts/src_sample_dts(22k)

pts/dst_sample_dst(44.1k)

可以看到第一帧的pts出现了偏移所以我们为了解决这个问题

我们需要通过进行时间轴缩放

将pts* ratio(src_sample_ratio/dst_sample_ratio)

此时的pts才是正确的pts

相关推荐
m0_726365837 小时前
Ai漫剧系统 几分钟,让AI 把一篇小说变成了一部漫剧成片:从剧本到视频的全流程系统实现
人工智能·语言模型·ai作画·音视频
非凡ghost11 小时前
可拓浏览器:给手机浏览器装上“外挂“!2W+拓展+AI搜索,玩出无限可能!
windows·智能手机·音视频·firefox
美狐美颜SDK开放平台13 小时前
多场景美颜SDK解决方案:直播APP(iOS/安卓)开发接入详解
android·人工智能·ios·音视频·美颜sdk·第三方美颜sdk·短视频美颜sdk
ai产品老杨15 小时前
深度解析:基于国产化异构计算的 AI 视频管理平台架构——从 GB28181 接入到 NPU 边缘推流的解耦实践
人工智能·架构·音视频
watson_pillow15 小时前
音视频相关基础知识储备入门-字幕
音视频
程序员JerrySUN16 小时前
Jetson边缘嵌入式实战课程第二讲:JetPack 和 SDK Manager 是什么
c语言·开发语言·网络·udp·音视频
weixin_66818 小时前
NVIDIA VSSVideo Search and Summarization视频搜索与摘要蓝图详尽使用说明与技术报告版本
人工智能·音视频
jiayong2318 小时前
国内外视频/图像大模型与智能体工具平台竞品对比
ai·音视频·agent
视频技术分享19 小时前
技术赋能生态革新:音视频产业开启千亿增长新周期 视频会议成核心增长亮点
音视频
reasonsummer19 小时前
【教学类-160-14】20260425 AI视频培训-练习014“豆包AI视频《月下枯蔷(哥特风)》+豆包图片风格:油画”
人工智能·音视频·豆包