音视频处理(一):什么决定了你的音色?声音的三要素

文章目录

概述

今天我们来介绍声音的三要素,声音的三要素包括:音调、音量和音色,学习声音的基本原理,对于音视频处理、自然语言识别NLP、ASR都是非常有帮助的。

一、音调

定义

音调是指音频的快慢,即声音的频率。

举例说明

以拨动尺子为例:

  • 尺子振动快,则音频高。
  • 尺子振动慢,则音频低。

日常生活中的体现

  • 男生的音频最低,声音浑厚、低沉。
  • 儿童的声音频率最高,比较悦耳。
  • 女生的声音频率介于两者之间。

结论:音频越高,声音越悦耳。声音悦耳程度顺序为:儿童 > 女生 > 男生。

二、音量

定义

音量由振幅大小决定。

举例说明

以拨动尺子为例:

  • 振幅大,推动空气流动的力量大,声音洪亮。
  • 振幅小,推动空气流动的力量弱,声音小。

波形分析

以正弦波为例:

  • 峰值与谷值差异大,则音量高。
  • 峰值与谷值差异小,则音量低。
  • 在相同频率下,峰值越高,音量越大。

三、音色

定义

音色由谐波决定,不同乐器或人声的音色不同,即使基频相同。

原理说明

自然界中的声音多为和声,由多个频率组合而成:

  • 基频:主频率,决定声音的主要走势。
  • 谐波:在基频上的微调,形成不同的音色。

波形合成

以合成波形为例:

  • 绿色波形代表基频。
  • 加入黄色(一次谐波)和橙色(二次谐波)波形后,合成粉色波形,形成复杂的音色。

结论:音色的差异由谐波决定,例如钢琴和小提琴即使基频相同,音色也不同。

总结

声音的三要素及其原理:

  1. 音量:由振幅决定,振幅越高,音量越大。
  2. 音调:由频率决定,频率快则音调高,频率慢则音调低。
  3. 音色:由谐波决定,谐波的不同组合形成不同的音色特质。
相关推荐
撬动未来的支点3 小时前
【音视频】MP4文件格式
音视频
刀客Doc9 小时前
复盘Netflix的2025:广告业务、线下业态和视频播客
人工智能·音视频
EasyGBS11 小时前
EasyGBS助力智慧医院打造全方位视频监控联网服务体系
网络·音视频
数字孪生家族11 小时前
视频孪生与空间智能:重构物理世界的时空认知范式
音视频·空间智能·数字孪生头部企业·视频孪生与空间智能融合
Tracy97315 小时前
XMAU7118_VC1:16通道PDM到I²S/TDM音频转换器产品介绍
嵌入式硬件·音视频·智能硬件·xmos模组固件
做萤石二次开发的哈哈15 小时前
萤石开放平台机器人音视频对接流程
机器人·音视频
Tracy97316 小时前
OT83211_VC1:4通道 ASRC OTG(44.1kHz~192kHz)音频采样率转换器产品介绍
嵌入式硬件·音视频·xmos 模组·xmos模组固件
电鱼智能的电小鱼21 小时前
基于电鱼 AI 工控机的智慧工地视频智能分析方案——边缘端AI检测,实现无人值守下的实时安全预警
网络·人工智能·嵌入式硬件·算法·安全·音视频
音视频牛哥1 天前
从协议规范和使用场景探讨为什么SmartMediaKit没有支持DASH
人工智能·音视频·大牛直播sdk·dash·dash还是rtmp·dash还是rtsp·dash还是hls
音视频牛哥1 天前
SmartMediaKit:如何让智能系统早人一步“跟上现实”的时间架构--从实时流媒体到系统智能的演进
人工智能·计算机视觉·音视频·音视频开发·具身智能·十五五规划具身智能·smartmediakit