语音处理:音频移形幻影,为何大振幅信号也无声

语音处理:音频移形幻影,为何大振幅信号也无声?

背景来由

在定位一个音频算法效果问题时,发现对一个序列某一段波形上下平移时,仅在两侧信号过渡时有听感异常,整体上移片段跟其余片段听感很类似。

我们知道,音频信号的波形左右平移会带来延迟的听感,即类似回声慢半拍。

于是想问,音频信号的波形上下平移会对听感怎么样呢?

提出问题

设计3个场景问题,来分析音频信号移形换影:

  • 1s左右固定大幅度的信号,听感会怎么样?
  • 2s左右且仅一个尖峰的信号,听感会怎么样?
  • 2s左右一个基础谐波组成信号,波形往上平移后不过零,听感会怎么样?

实验代码

matlab 复制代码
%% eval_voice_shift.m: 模拟音频移形变化效果 
clear; clc; close all;


%% 构造1s固定大振幅的音频
fs = 48000;                     % 采样率
duration = 1; % 时长s
t = (0: 1/fs : duration-1/fs)';         % 示例语音片段
x = ones([length(t), 1]);
x = 0.5 * x;
audiowrite('D:\test1.wav', x, fs, 'BitsPerSample', 16);


%% 构造2s尖峰变化音频
fs = 48000;                     % 采样率
duration = 2; % 时长s
t = (0: 1/fs : duration-1/fs)';
samples = length(t);
samples_left = samples / 2;
samples_right = samples - samples_left;
x_left = linspace(0,0.5,samples_left)';
x_right = linspace(0.5,0,samples_right)';
x = [x_left; x_right];
audiowrite('D:\test2.wav', x, fs, 'BitsPerSample', 16);


%% 构造2s不过零的正弦波音频
fs = 48000;                     % 采样率
duration = 2; % 时长s
f0 = 100; % hz
t = (0: 1/fs : duration-1/fs)';
x = 2*sin(2*pi*f0*t) + 3*cos(0.24*pi*f0*t);
x_min = min(x);
x_base = x;
x_proc = x + abs(x_min);
y = [x_base x_proc];
audiowrite('D:\test3.wav', y, fs, 'BitsPerSample', 32);

TST_done = 1

我用matlab做了3个仿真实验,并得到了结果。

  • 场景一,test1.wav中1s大幅度固定信号,听感无声。

  • 场景二,test2.wav中2s尖峰信号,听感无声。

  • 场景三,test3.wav中2s谐波组成信号上移后,听感音色类似,但力度有所下降。

为啥信号有较大幅值,会听起来无声? 将波形移动,过不过零是否有听感影响? 不由引人深思。

现象分析

总的说来,一个波形信号上下平移后,考虑到实际喇叭振膜,类似于物理世界里振膜换了一个中心振动,对音色无较大影响,对复杂信号响度可能有影响。

此外,要听到声音要有一定频率的振动,如果信号在长时间内缓慢变化,类似于直流分量了(低频强度远小于20Hz),人耳无法感知。

所以,场景一中大幅度固定信号等效于幅值为0的信号往上平移,听感无声。

而场景二,你说它到底有声吗?有,只是我们听不到。尖峰信号变化过慢,频率远小于20Hz故听感无声,就像你拳头极慢挥出听不声音但快速打出去就能听到声音一样。

场景三中就对应了虽然不过零,但频率足够快时,就能听到声音,对这个波形上下移形换影,听感音色类似,仅响度有所区别。原始的会更有力些,可能是由于扬声器远离基轴回弹过小的,向上移动后整体不够有力。

问题小结

了解唯有振动变化才能产生声波的本质后,再回答这些问题是不是就简单了:任意一个固定幅值的信号听感如何? 一个正弦波平移后不过零,与之前听感如何?

最后,通过此次实验,我这半路出家音频的门外汉对声学振动、频率、响度以及数字信号发声有了更深认识。

也刷新了一点点认知:数字信号里不是全零才无声,全固定值或者变化很慢的波形均无声

振动有魔力。

相关推荐
CryptoRzz7 分钟前
日本股票 API 对接实战指南(实时行情与 IPO 专题)
java·开发语言·python·区块链·maven
yugi9878388 分钟前
基于M序列的直扩信号扩频码生成方法及周期长码直扩信号的MATLAB实现方案
开发语言·matlab
乾元15 分钟前
基于时序数据的异常预测——短期容量与拥塞的提前感知
运维·开发语言·网络·人工智能·python·自动化·运维开发
江上清风山间明月15 分钟前
使用python将markdown文件生成pdf文件
开发语言·python·pdf
j_xxx404_18 分钟前
C++算法入门:二分查找合集(二分查找|在排序数组中查找元素的第一个和最后一个位置)
开发语言·c++
ss27321 分钟前
阻塞队列:ArrayBlockingQueue如何用Lock与Condition实现高效并发控制
开发语言·python
CodeCraft Studio25 分钟前
Vaadin 25 正式发布:回归标准Java Web,让企业级开发更简单、更高效
java·开发语言·前端·vaadin·java web 框架·纯java前端框架·企业级java ui框架
Shirley~~28 分钟前
PPTist 幻灯片工具栏Toolbar部分
开发语言·前端·javascript
|晴 天|29 分钟前
Promise 与 async/await 错误处理最佳实践指南
开发语言·前端·javascript
_OP_CHEN31 分钟前
【Python基础】(三)Python 语法基础进阶:条件循环 + 实战案例,从入门到精通的核心跳板
开发语言·python·python入门·条件语句·循环语句·python基础语法