python实现音频文件mp3/m4a转.wav + windows安装ffmpeg

近期在尝试使用大模型进行音频降噪、人声分离。抱脸上的模型几乎统一输入需求都是.wav,直接贴代码吧

ps:使用这段代码需要提前安装好ffmpeg(安装教程请往下拉)

python 复制代码
from pydub import AudioSegment

# 加载.m4a文件
audio = AudioSegment.from_file(r"你文件的路径")

# 转换并保存为.wav文件
audio.export(r"输出的路径", format="wav")

几个小注意点:

提示Invalid file,可以按这几个方式尝试:

1.确保已经正确安装ffmpeg,pydub实际上仍然是ffmpeg的功能封装库,底层是依靠ffmpeg来实现的

2.尝试以管理员身份运行pycharm或vscode(win),linux使用sudo即可

如何快速安装ffmpeg:

进入官网:ffmpeg官网下载链接

找到红色框选的绿色文字链接,点击下载即可,下载大概率需要魔法,暂时麻瓜的可以先用我上传度盘的(2024/10/10)

链接:度盘链接

下载后是一个rar文件,解压到各自存储工具的地址,然后打开到bin文件夹(里面正常应该有3个.exe文件),复制文件夹路径

然后打开环境变量,在用户变量--Path中加入刚才复制的路径:

最后使用cmd窗口输入:

复制代码
ffmpeg -version

显示如下界面即可

相关推荐
badhope4 小时前
Mobile-Skills:移动端技能可视化的创新实践
开发语言·人工智能·git·智能手机·github
码云数智-园园5 小时前
微服务架构下的分布式事务:在一致性与可用性之间寻找平衡
开发语言
吴佳浩6 小时前
GPU 编号进阶:CUDA\_VISIBLE\_DEVICES、多进程与容器化陷阱
人工智能·pytorch·python
C++ 老炮儿的技术栈6 小时前
volatile使用场景
linux·服务器·c语言·开发语言·c++
hz_zhangrl6 小时前
CCF-GESP 等级考试 2026年3月认证C++一级真题解析
开发语言·c++·gesp·gesp2026年3月·gespc++一级
Liu628886 小时前
C++中的工厂模式高级应用
开发语言·c++·算法
IT猿手6 小时前
基于控制障碍函数的多无人机编队动态避障控制方法研究,MATLAB代码
开发语言·matlab·无人机·openclaw·多无人机动态避障路径规划·无人机编队
全栈凯哥6 小时前
18.Python中的导入类完全指南
python
AI科技星6 小时前
全尺度角速度统一:基于 v ≡ c 的纯推导与验证
c语言·开发语言·人工智能·opencv·算法·机器学习·数据挖掘
sunwenjian8867 小时前
Java进阶——IO 流
java·开发语言·python