一款强大的音视频处理工具--FFmpeg-2--常用音频处理示例

1、查看音频文件详细信息

opus,wav,pcm等音频格式都适用。

bash 复制代码
ffprobe -i 1.opus


说明:

Input 0, ogg, from '1.opus':

  • Input 0:表示这是第一个输入文件。
  • ogg:表示该文件封装在Ogg容器格式中(Opus通常封装在Ogg中)。
  • from '1.opus':源文件名是1.opus。
    Duration: 00:00:10.01, start: 0.000000, bitrate: 67 kb/s
    • Duration: 音频总时长为10.01秒
  • start: 起始时间为0秒
  • bitrate: 平均比特率为67kbps
    Stream 0:0: Audio: opus, 48000 Hz, mono, fltp
  • Stream 0:0:第一个输入文件的第一个流(即音频流)
  • Audio: opus: 使用的音频编码为 Opus
  • 48000 Hz: 采样率为 48 kHz(Opus 的标准采样率)
  • mono: 单声道(只有一个音频通道)
  • fltp: 浮点型样本格式(32-bit floating point, planar)
    Metadata: encoder : Lavc58.134.100 libopus
  • encoder表示该音频是由libopus编码器编码生成的。
  • Lavc58.134.100是FFmpeg的音频编码库版本号。

查看详情或者使用:

bash 复制代码
ffprobe -v error -show_entries stream=index,codec_name,codec_type,channels,sample_rate,channel_layout,format,sample_fmt,bits_per_sample -of default=nw=1 1.opus


在或者:

bash 复制代码
file 1.wav

2、wav转opus

bash 复制代码
ffmpeg -i 1.wav -c:a libopus 1.opus


说明:

  • -i 1.wav: 指定输入文件为input.wav
  • -c:a libopus: 使用Opus编码器进行编码
  • 1.opus: 输出文件名

3、wav转pcm

bash 复制代码
ffmpeg -i 1.wav -f s16le -acodec pcm_s16le 1.pcm


命令说明:

  • -f 表示强制指定封装格式(format)。
  • s16le 是一种raw PCM的封装格式:
    • s:signed(有符号)
    • 16:16 bit(每个样本2字节)
    • le:little-endian(小端字节序)
  • acodec pcm_s16le: 指定音频编解码器为PCM signed 16-bit little-endian。

批量处理文件夹中的所有wav文件,且指定频率和声道:

bash 复制代码
for file in /data/zhangwei/pcm/wav2pcm/*.wav; do 
    ffmpeg -i "$file" -f s16le -acodec pcm_s16le -ar 16000 -ac 1 "${file%.wav}.pcm"
done

-ar指定频率16kHz,-ac指定声道数量为1。

pcm文件说明:

  • 无文件头:.pcm文件是一个纯音频裸流文件,没有WAV、MP3等容器的元信息。
  • 内容:仅包含原始PCM数据,每两个字节代表一个采样点。
  • 播放方式:
    • 需要你知道它的采样率、声道数、样本格式才能正确播放。
    • 可以用工具如ffplay或专业软件(Audition CC)加载播放。

4、opus转wav

bash 复制代码
ffmpeg -i 1.opus 11.wav

说明:

这里FFmpeg自动选择合适的解码器并将Opus流解码为PCM,然后将其封装到WAV容器中。默认解码器其实就是pcm_s16le,当然如果必要也可以动态指定使用的解码器。

指定pcm_s16le示例:

bash 复制代码
ffmpeg -i 1.opus -c:a pcm_s16le 11.wav

ffmpeg -i 1734442380625.opus -ar 48000 -ac 1 -c:a pcm_s16le output1.wav

或更详细指定输出格式:

bash 复制代码
ffmpeg -i 1.opus \
  -ar 48000 -ac 1 -sample_fmt s16 \
  -c:a pcm_s16le \
  1111.wav

或:绝对路径

bash 复制代码
ffmpeg -i /data/zhangwei/opus/1734442380625.opus -ar 48000 -ac 1 -c:a pcm_s16le /data/zhangwei/opus/output2.wav


说明:

指定输出:48kHz采样率,单声道,16-bit PCM。

-ar 48000:指定输出采样率为 48000 Hz。

-ac 1:指定输出为单声道

5、opus转pcm

bash 复制代码
ffmpeg -i 11.opus -f s16le -acodec pcm_s16le 11.pcm


说明:

  • -i 11.opus:输入opus文件路径。
  • -f s16le:指定输出格式为小端16位整数PCM。
  • -acodec pcm_s16le:使用pcm_s16le编码器来解码音频流。
  • 11.pcm:输出PCM文件路径。

注意,默认情况下,FFmpeg会根据输入音频的参数(如采样率、声道数)来决定输出PCM的相应参数。如果你需要特定的输出参数,比如更改采样率或声道数,可以加上相应的选项:

bash 复制代码
ffmpeg -i 11.opus -f s16le -ar 96000 -ac 1 11_96k.pcm


说明:

强制将输出PCM的采样率设置为96kHz,声道数设置为单声道(-ac 1)。

6、pcm转wav

bash 复制代码
ffmpeg -f s16le -ar 48000 -ac 1 -i 1.pcm 111.wav


说明:

  • -f s16le: 输入文件格式为小端16位整数PCM。
  • -ar 48000: 设置采样率为48kHz。
  • -ac 1: 设置为单声道。

7、pcm转opus

bash 复制代码
ffmpeg -f s16le -ar 48000 -ac 1 -i 1.pcm -c:a libopus 11.opus


说明:

  • -f s16le:指定输入文件格式为小端16位整数PCM。
  • -ar 48000:设置输入音频的采样率为48kHz。根据实际情况调整。
  • -ac 1:设置输入音频的声道数为1。根据实际情况调整。
  • -i input.pcm:输入PCM文件路径。
  • -c:a libopus:指定使用libopus编码器。
  • output.opus:输出Opus文件路径。

8、mp3转pcm(同wav转一致)

同wav转pcm一致。

bash 复制代码
ffmpeg -i /data/zhangwei/pcm/mp32pcm/黑2.mp3 -f s16le -acodec pcm_s16le -ar 16000 -ac 1 /data/zhangwei/pcm/mp32pcm/黑2.pcm


命令说明:

  • -f 表示强制指定封装格式(format)。
  • s16le 是一种raw PCM的封装格式:
    • s:signed(有符号)
    • 16:16 bit(每个样本2字节)
    • le:little-endian(小端字节序)
  • -acodec pcm_s16le: 指定音频编解码器为PCM signed 16-bit little-endian。
    --ar 16000,指定输出频率16kHz。
    --ac 1,指定单通道。

如果要批量处理整个文件夹下的mp3文件,执行如下:

bash 复制代码
for file in /data/zhangwei/pcm/mp32pcm/*.mp3; do 
    ffmpeg -i "$file" -f s16le -acodec pcm_s16le -ar 16000 -ac 1 "${file%.mp3}.pcm"
done

9、arm转pcm(同wav一致)

bash 复制代码
ffmpeg -i 陈建强024-09-03-19-38-15.amr -f s16le -acodec pcm_s16le -ar 16000 -ac 1 output.pcm


命令说明:

  • -f 表示强制指定封装格式(format)。
  • s16le 是一种raw PCM的封装格式:
    • s:signed(有符号)
    • 16:16 bit(每个样本2字节)
    • le:little-endian(小端字节序)
  • -acodec pcm_s16le: 指定音频编解码器为PCM signed 16-bit little-endian。
    --ar 16000,指定输出频率16kHz。
    --ac 1,指定单通道

向阳而生,Dare To Be!!!

相关推荐
REDcker4 天前
WebCodecs VideoDecoder 的 hardwareAcceleration 使用
前端·音视频·实时音视频·直播·webcodecs·videodecoder
gihigo19984 天前
基于TCP协议实现视频采集与通信
网络协议·tcp/ip·音视频
山河君4 天前
四麦克风声源定位实战:基于 GCC-PHAT + 最小二乘法实现 DOA
算法·音视频·语音识别·信号处理·最小二乘法·tdoa
音视频牛哥5 天前
Android平台RTMP/RTSP超低延迟直播播放器开发详解——基于SmartMediaKit深度实践
android·人工智能·计算机视觉·音视频·rtmp播放器·安卓rtmp播放器·rtmp直播播放器
qq_416276425 天前
通用音频表征的对比学习
学习·音视频
美狐美颜sdk5 天前
Android全局美颜sdk实现方案详解
人工智能·音视频·美颜sdk·视频美颜sdk·美狐美颜sdk
EasyDSS5 天前
私有化部署EasyDSS视频点播能力:全链路视频技术赋能,打造企业级视听新体验
音视频·hls·m3u8·点播技术·智能转码
qq_416276425 天前
DeLoRes——一种通用的音频表征学习新方法(DeLoRes(基于 Barlow Twins 的冗余最小化方法)
学习·音视频
Q_4582838685 天前
从定位到视频:808 + 1078 在各行业的落地实践
音视频
山顶望月川5 天前
实测MiniMax-Hailuo-02:当“开工大吉“变成“无字天书“,国产AI视频模型的能与之不能
人工智能·音视频