Pydub:用 Python 处理音频,不写废话

文章目录

  • [Pydub:用 Python 处理音频,不写废话](#Pydub:用 Python 处理音频,不写废话)
    • [1、 核心能力](#1、 核心能力)
    • [2、 链式调用](#2、 链式调用)
    • [3、 调试](#3、 调试)
    • [4、 安装](#4、 安装)
    • [5、 实际场景](#5、 实际场景)
    • [6、 适合谁](#6、 适合谁)

Pydub:用 Python 处理音频,不写废话

Pydub 在 GitHub 上已经拿到 9,763 个 Star。

这个 Python 库的目标是让音频操作变得简单直观。打开文件、剪片段、调音量、拼接、淡入淡出、格式转换,全部链式调用,几行代码写完。

1、 核心能力

打开音频文件:

复制代码
from pydub import AudioSegment
song = AudioSegment.from_wav("file.wav")
song = AudioSegment.from_mp3("file.mp3")

MP3、WAV、Ogg、FLV、MP4,只要 ffmpeg 支持的格式,它都认识。统一用 AudioSegment 对象,不用为每种格式写不同的解析逻辑。

切片基于毫秒:

复制代码
first_10_seconds = song[:10000]
last_5_seconds = song[-5000:]

调音量直接用加减运算符:

复制代码
louder = first_10_seconds + 6
quieter = last_5_seconds - 3

拼接和重复:

复制代码
mix = beginning + end
loop = mix * 2

2、 链式调用

因为每个操作都返回新的 AudioSegment,可以一口气串起来:

复制代码
result = (song[:10000] + 6)
    .append(song[-5000:] - 3, crossfade=1500)
    .fade_in(2000)
    .fade_out(3000)
result.export("output.mp3", format="mp3", bitrate="192k")

不用手动算帧率,不用管采样率,不用写循环。AudioSegment 是不可变对象,所有操作不修改原数据。

导出时支持更多参数,直接透传给 ffmpeg:

复制代码
song.export("output.mp3", format="mp3",
    parameters=["-ac", "2", "-vol", "150"],
    tags={"artist": "Pydub", "album": "Demo"})

3、 调试

转换出错时可以打开日志,查看实际执行的 ffmpeg 命令:

复制代码
import logging
l = logging.getLogger("pydub.converter")
l.setLevel(logging.DEBUG)
l.addHandler(logging.StreamHandler())

大多数转换问题来自 ffmpeg 环境配置,日志能直接暴露是哪一步出了问题。

4、 安装

复制代码
pip install pydub

然后装 ffmpeg。macOS 用 brew install ffmpeg,Linux 用 apt-get install ffmpeg,Windows 下载二进制文件加到 PATH 就行。

5、 实际场景

批量转视频为音频:

复制代码
import glob
from pydub import AudioSegment

for video in glob.glob("*.mp4"):
    mp3 = video.replace(".mp4", ".mp3")
    AudioSegment.from_file(video).export(mp3, format="mp3")

拼接歌单,带交叉淡化:

复制代码
playlist = None
for mp3_file in glob("*.mp3"):
    song = AudioSegment.from_mp3(mp3_file)
    if playlist is None:
        playlist = song[:30000]
    else:
        playlist = playlist.append(song, crossfade=10000)
playlist.fade_out(30000).export("mix.mp3", format="mp3")

6、 适合谁

处理音频批量的开发者、做播客剪辑工具的、跑语音识别预处理的、需要在 Python 项目里加音效播放的。API 足够直观,看过 Quickstart 就能上手。

项目基于 MIT 协议,由 James Robert 在 2011 年发布,社区活跃,问题可以在 Stack Overflow 上找到解答。

thon 项目里加音效播放的。API 足够直观,看过 Quickstart 就能上手。

项目基于 MIT 协议,由 James Robert 在 2011 年发布,社区活跃,问题可以在 Stack Overflow 上找到解答。

相关推荐
炎武丶航2 小时前
LeNet-5深度学习详解:从手写数字识别到代码实战
人工智能·python·深度学习·机器学习·ai·cnn·lenet
xingyuzhisuan2 小时前
缓存命中率提升方案:从 30% 优化至 82% 全流程优化记录
java·开发语言·缓存·ai
TechWayfarer2 小时前
云服务器地域怎么选:用离线IP数据库识别用户来源并优化部署
服务器·数据库·python·tcp/ip·数据分析
梦想不只是梦与想2 小时前
Python 中的进程(Process)
python·进程·进程间通
郑洁文2 小时前
基于Python的恶意流量监测系统的设计与实现
开发语言·python
星辰徐哥2 小时前
Python AI基础:Matplotlib与Seaborn数据可视化
人工智能·python·matplotlib
AI玫瑰助手2 小时前
Python流程控制:for循环与range函数的搭配使用
开发语言·python·信息可视化
anew___2 小时前
2026年Python爬虫技术完全指南:从入门到实战
开发语言·爬虫·python
Jinkxs2 小时前
Python基础 - 初识内置函数 Python自带的便捷工具
android·java·python