ffmpeg 切割音频文件,各种格式(wav, flac, mp3, m4a等)

动机

想要用pydub切割音频来制作数据集,结果发现ffmpeg不支持m4a格式的数据输出。

复制代码
from pydub import AudioSegment
path = r"D:\data\upload"
save_path = r"D:\data\train\upload"

files = os.listdir(path)

for file in files:
    audio = AudioSegment.from_file(path+'\\'+file, "flac")

    size = 2000  # 切割的毫秒数 60s=60000
    chunks = make_chunks(audio, size)
    for i, chunk in enumerate(chunks):
        chunk_name = file.split('.')[0] + f"_{i}.flac"
        print(chunk_name)
        chunk.export(save_path+'\\'+chunk_name, format="flac")

报错信息:

Input #0, wav, from 'C:\Users\AAA\AppData\Local\Temp\tmp_g6wtefp':

Duration: 00:00:02.00, bitrate: 512 kb/s

Stream #0:0: Audio: pcm_s16le (1000 / 0x0001), 32000 Hz, 1 channels, s16, 512 kb/s AVFormatContext @ 0000027c7f0bb680 Requested output format 'm4a' is not known.

解决办法

参考了大佬的使用 ffmpeg 来对音频文件(mp3、m4a 等)进行分割 方法,但是一条一条输命令太麻烦了,所以用python的os.system来试着自动化。这里记录一下方便以后使用。

复制代码
files = os.listdir(path)

for file in files:
    # audio = AudioSegment.from_file(path+'\\'+file, "m4a")
    cmd = f"ffmpeg -i {path}\{file} -f segment -segment_time 2 -write_xing 0 -c copy {save_path}\{file.split('.')[0]}_%d.m4a"
    os.system(cmd)

ffmpeg -i file.m4a -f segment -segment_time 900 -write_xing 0 -c copy out%03d.m4a

  • -i:输入文件;
  • -f:强制格式,即目标格式,这里指定为 segment,即分割;
  • -segment_time:每段的时长,单位为秒,示例是按每 5 分钟来切割;
  • -c:指定编码名称(codec),这里我们不打算重新编码,于是用 copy,非常快;
  • write_xing 0:参数指示禁用Xing头部信息的写入
相关推荐
都在酒里1 天前
【极致低延时】香橙派部署 MediaMTX 实现 WebRTC 推流,延时仅 500-800ms,比局域网 ffmpeg 拉流快近 10 倍!(附踩坑全记录)
linux·arm开发·ffmpeg·webrtc·orangepi·嵌入式软件
Empty-Filled1 天前
用 Kap + FFmpeg 把录屏转成小体积 GIF:产品操作演示图制作实践
ffmpeg·kap
矜辰所致2 天前
嵌入式语音开发应用基础说明
ffmpeg·ai 语音·嵌入式语音·语音播放·语音采样
luoyayun3612 天前
Qt + FFmpeg 实战:音频静音段检测
qt·ffmpeg·音视频·静音段检测
小鹿研究点东西4 天前
直播带货长视频AI自动剪辑开播:一场直播如何反复利用?
ffmpeg·自动化·音视频·语音识别
luoyayun3614 天前
Qt + FFmpeg 实战:获取音视频文件基础属性、流信息和元数据
qt·ffmpeg·音视频·元数据·获取音视频文件属性
Rudon滨海渔村4 天前
ffmpeg裁剪视频黑屏、不准时等处理方式 - ffmpeg基本操作
ffmpeg·音视频
The Sheep 20235 天前
ffmpeg速成
ffmpeg
街灯L5 天前
【Ubuntu】使用ffmpeg解析m3u8网页视频
ubuntu·ffmpeg·音视频
烟雨江南7856 天前
特高压输电线路带电作业直升机吊篮与强电磁感应放电:基于“灵声智库”空间自适应滤波与声纹授权的离线语音控制指令方案
人工智能·ffmpeg·webrtc·语音识别·ai质检