一、格式转换(最常用)支持:wav /mp3 /flac/ogg /aac/raw 等几乎所有格式
bash
sox input.mp3 output.wav
sox input.wav output.flac
sox input.wav output.ogg
#例1
sox -t raw -c 4 -b 16 -r 16000 -e signed-integer "$file.pcm" "${file.pcm}.wav"
指定输入文件的格式为原始音频 (-t raw),通道数为 (-c 4),采样位数为& (-b 16),采样率为 (-r 16000),采样格式为有符号整数 (-e signed-integer),然后将输入文件file.pcm转换为WAV格式,并将输出文件命名file.pcm转换为WAV格式,并将输出文件命名file.pcm转换为WAV格式,并将输出文件命名{file.pcm}.wav
二、音频信息查看
c
soxi input.wav # 查看采样率、声道、位深、时长
sox --i input.wav
三、裁剪音频(截取片段)
c
sox input.wav out.wav trim 开始时间 时长
sox input.wav out.wav trim 10 5 # 从第10秒开始,截5秒
四、拼接 / 合并多个音频
c
sox 1.wav 2.wav 3.wav output.wav
五、混音(叠加两个声音,多声道)
c
sox -m voice.wav bgm.wav mix.wav
六、降噪(超常用)
c
sox in.wav out.wav noiseprof profile.prof
sox in.wav out.wav noisered profile.prof 0.5
七、重采样(改采样率、声道)
c
sox in.wav out.wav rate 16000 # 改成 16k 采样率
sox in.wav out.wav channels 1 # 转单声道
sox in.wav out.wav channels 2 # 转双声道
八、倒放
c
sox in.wav out.wav reverse
九、静音生成 / 插入静音
c
sox -n silence.wav trim 0 5 # 生成 5 秒静音
sox in.wav silence.wav out.wav # 末尾加静音
十、提取声道
c
sox stereo.wav channel.wav remix 1
sox stereo.wav channe2.wav remix 2
sox stereo.wav channe3.wav remix 3
sox stereo.wav channe4.wav remix 4