python实现音频文件mp3/m4a转.wav + windows安装ffmpeg

近期在尝试使用大模型进行音频降噪、人声分离。抱脸上的模型几乎统一输入需求都是.wav,直接贴代码吧

ps:使用这段代码需要提前安装好ffmpeg(安装教程请往下拉)

python 复制代码
from pydub import AudioSegment

# 加载.m4a文件
audio = AudioSegment.from_file(r"你文件的路径")

# 转换并保存为.wav文件
audio.export(r"输出的路径", format="wav")

几个小注意点:

提示Invalid file,可以按这几个方式尝试:

1.确保已经正确安装ffmpeg,pydub实际上仍然是ffmpeg的功能封装库,底层是依靠ffmpeg来实现的

2.尝试以管理员身份运行pycharm或vscode(win),linux使用sudo即可

如何快速安装ffmpeg:

进入官网:ffmpeg官网下载链接

找到红色框选的绿色文字链接,点击下载即可,下载大概率需要魔法,暂时麻瓜的可以先用我上传度盘的(2024/10/10)

链接:度盘链接

下载后是一个rar文件,解压到各自存储工具的地址,然后打开到bin文件夹(里面正常应该有3个.exe文件),复制文件夹路径

然后打开环境变量,在用户变量--Path中加入刚才复制的路径:

最后使用cmd窗口输入:

复制代码
ffmpeg -version

显示如下界面即可

相关推荐
浅时光_c几秒前
12 指针
c语言·开发语言
AC赳赳老秦2 分钟前
OpenClaw text-translate技能:多语言批量翻译,解决跨境工作沟通难题
大数据·运维·数据库·人工智能·python·deepseek·openclaw
charlie1145141914 分钟前
嵌入式现代C++工程实践——第10篇:HAL_GPIO_Init —— 把引脚配置告诉芯片的仪式
开发语言·c++·stm32·单片机·c
call me by ur name6 分钟前
ERNIE 5.0 Technical Report论文解读
android·开发语言·人工智能·机器学习·ai·kotlin
dog2506 分钟前
细看高维空间中距离度量失效
开发语言·php
码云数智-大飞8 分钟前
Rust的所有权模型如何消除内存安全问题?与C++的RAII有何异同?
开发语言
如意猴11 分钟前
【前端】002--怎样制作一个简历界面?
开发语言·前端·javascript
夜珀14 分钟前
OpenTiny NEXT 从入门到精通·第 6 篇
开发语言·前端框架
JaydenAI23 分钟前
[Python编程思想与技巧-01]我所理解的Python元模型
python·元宇宙·元类·元模型
清水白石00829 分钟前
《Python 架构师的自动化哲学:从基础语法到企业级作业调度系统与 Airflow 止损实战》
数据库·python·自动化