系列文章目录
多媒体音频基础知识及格式的介绍文章系列:
音频基础知识介绍:音频基础知识
https://blog.csdn.net/littlezls/article/details/135917303
音频基础知识介绍:音频几个相关概念及心理声学模型
https://blog.csdn.net/littlezls/article/details/135499627
音频编解码格式介绍:音频编码格式介绍
https://blog.csdn.net/littlezls/article/details/135862140
音频编解码格式介绍(1) ADPCM:adpcm编解码原理及其代码实现
https://blog.csdn.net/littlezls/article/details/83501580
音频编解码格式介绍(2) MP3 :音频格式之MP3:(1)MP3封装格式简介
https://blog.csdn.net/littlezls/article/details/135705670
音频编解码格式介绍(2) MP3 :音频格式之MP3:(2)MP3编解码原理详解
https://blog.csdn.net/littlezls/article/details/135458169
音频编解码格式介绍(3) AAC :音频格式之AAC:(1)AAC简介
https://blog.csdn.net/littlezls/article/details/135692305
音频编解码格式介绍(3) AAC :音频格式之AAC:(2)AAC封装格式ADIF,ADTS,LATM,extradata及AAC ES存储格式
https://blog.csdn.net/littlezls/article/details/135705383
音频编解码格式介绍(3) AAC :音频格式之AAC:(3)AAC编解码原理详解
https://blog.csdn.net/littlezls/article/details/135777833
文章目录
- 系列文章目录
- 前言
- 1、声音
- 2、基本概念
-
- [2.1、 音频信号](#2.1、 音频信号)
- 2.2、采样率
- 2.3、位深
- 2.4、声道数
- 2.5、比特率
- 2.6、音频帧
- 2.7、信噪比(SNR)
- 2.8、模拟信号与数字信号
- 2.9、量化编码
- 3、音频三要素包括音调、响度和音色
- 4、补充
前言
本文简单介绍一下音频基础知识。
本文网址:https://blog.csdn.net/littlezls/article/details/135917303
1、声音
声音(sound)是由物体振动产生的声波。声音作为一种机械波,频率在20 Hz~20 kHz之间的声音是可以被人耳识别的。
2、基本概念
2.1、 音频信号
音频信号是一种能量波,由物体的振动产生,其特性包括频率、振幅和相位。
2.2、采样率
采样率(也称为采样速度或者采样频率)定义了每秒从模拟信号中提取并组成数字信号的采样个数,它用赫兹(Hz)来表示。采样频率的倒数叫作采样周期或采样时间,它是采样之间的时间间隔。
2.2.1、采样定理
采样定理表明采样频率必须大于被采样信号带宽的两倍,另外一种等同的说法是奈奎斯特频率必须大于被采样信号的带宽。 如果信号的带宽是100Hz,那么为了避免混叠现象采样频率必须大于200Hz。换句话说就是采样频率必须至少是信号中最大频率分量频率的两倍,否则就不能从信号采样中恢复原始信号。
正常人听觉的频率范围大约是20HZ~20kHZ之间,根据奈奎斯特理论(只有采样频率高于声音信号最高频率的两倍时,才能把数字信号表示的声音还原成为原来的声音),为了保证声音不失真,采样频率应该在40KHz左右。常用的音频采样频率有8kHz、11.025kHz、22.05kHz、16kHz、37.8kHz、44.1kHz、48kHz等。
2.2.2、常用的采样率
采样率决定了音频的质量,常见的采样率有44100Hz(音频CD的标准)和48000Hz(MPEG-1音频的标准)
在数字音频领域,常用的采样率有:
8,000 Hz - 电话所用采样率,对于人的说话已经足够
11,025 Hz
22,050 Hz - 无线电广播所用采样率
32,000 Hz - miniDV数码视频camcorder、DAT(LP mode)所用采样率
44,100 Hz - 音频CD,也常用于MPEG-1音频(VCD, SVCD, MP3)所用采样率
47,250 Hz - Nippon Columbia(Denon)开发的世界上第一个商用PCM录音机所用采样率
48,000 Hz - miniDV、数字电视、DVD、DAT、电影和专业音频所用的数字声音所用采样率
50,000 Hz - 二十世纪七十年代后期出现的3M和Soundstream开发的第一款商用数字录音机所用采样率
50,400 Hz - 三菱X-80数字录音机所用所用采样率
96,000或者192,000 Hz - DVD-Audio、一些LPCM DVD音轨、Blu-ray Disc(藍光碟)音轨、和HD-DVD(高清晰度DVD)音轨所用所用采样率
2.8224 MHz - SACD、索尼和飞利浦联合开发的称为Direct Stream Digital的1位sigma-delta modulation过程所用采样率。
2.3、位深
位深决定了音频信号的精度,位数越高,音频信号的精度越高,音频的质量就越好。常见的位深有8位、16位、24位等。
2.4、声道数
声道数表示声音录制或回放的通道数。常见的声道有单声道(Mono)和双声道(Stereo)。其次2.1声道、5.1声道和7.1声道等;
2.5、比特率
比特率是指每秒传送的比特(bit)数。单位为 bps(Bit Per Second),比特率越高,传送的数据越大,音质越好。
CD音质的文件:
44.1kHz * 16bit * 2通道 = 1411200 bit/s = 1411 kbps
这就是CD音质音频文件,每秒有141万位信息,换算一下: 1411200bps/8/1024/1024 = 0.168MB
2.6、音频帧
音频帧是音频数据的基本单位,一般以2.5ms~60ms为单位的数据量为一帧音频。
2.7、信噪比(SNR)
信噪比是原始信号和内部噪声强度的比值,信噪比越高,音频质量越好。
2.8、模拟信号与数字信号
模拟信号是连续信号,时间和幅度都是连续的;数字信号则是将模拟信号转换为在时间维度和频率维度上不连续的信号。模拟信号到数字信号的转换需要进行采样和量化。
2.9、量化编码
模拟数据 -> 采样 -> 量化 -> 编码 -> 数字信号
3、音频三要素包括音调、响度和音色
3.1、音调
音调是指声音的高低,由频率决定,频率越高音调越高。人耳的听觉范围在20-20000Hz之间,其中低于20Hz的称为次声波,高于20000Hz的称为超声波。
3.2、响度
响度是指声音的大小,也称为音量,是振幅的量度。响度越大,声音越强。
3.3、音色
音色则描述了声音的品质和特征,它是由波形和泛音决定的。不同的乐器或人声会发出不同音色的声音,通过音色可以区分不同的音源。
4、补充
4.1、音频文件格式
不同的音频文件格式对应不同的编码方式和压缩方式,常见的音频文件格式有WAV、MP3、AAC等。
4.2、音频处理
音频处理是指对音频信号进行各种处理,以改变其特性或增加效果。常见的音频处理技术包括均衡、压缩、混响等。
4.3、音频分析
音频分析是指对音频信号进行测量、分析和评估,以获取其特性或质量信息。常见的音频分析技术包括频谱分析、动态分析、清晰度分析等。
4.4、音频合成
音频合成是指通过声音合成技术,创造新的声音或音乐。常见的音频合成技术包括采样合成、波形合成、算法合成等。
4.5、其他音频技术
音频基础知识还包括音频处理技术,如音频采集、音频数据传输、音频-视频同步、音频效果与编辑、语音编码/解码、文-语转换、音乐合成、语音增强、噪声抑制,回声消除、麦克风阵列、解混响、声源定位、盲源分离、语音识别与理解、合成等。