python实现音频文件mp3/m4a转.wav + windows安装ffmpeg

近期在尝试使用大模型进行音频降噪、人声分离。抱脸上的模型几乎统一输入需求都是.wav,直接贴代码吧

ps:使用这段代码需要提前安装好ffmpeg(安装教程请往下拉)

python 复制代码
from pydub import AudioSegment

# 加载.m4a文件
audio = AudioSegment.from_file(r"你文件的路径")

# 转换并保存为.wav文件
audio.export(r"输出的路径", format="wav")

几个小注意点:

提示Invalid file,可以按这几个方式尝试:

1.确保已经正确安装ffmpeg,pydub实际上仍然是ffmpeg的功能封装库,底层是依靠ffmpeg来实现的

2.尝试以管理员身份运行pycharm或vscode(win),linux使用sudo即可

如何快速安装ffmpeg:

进入官网:ffmpeg官网下载链接

找到红色框选的绿色文字链接,点击下载即可,下载大概率需要魔法,暂时麻瓜的可以先用我上传度盘的(2024/10/10)

链接:度盘链接

下载后是一个rar文件,解压到各自存储工具的地址,然后打开到bin文件夹(里面正常应该有3个.exe文件),复制文件夹路径

然后打开环境变量,在用户变量--Path中加入刚才复制的路径:

最后使用cmd窗口输入:

复制代码
ffmpeg -version

显示如下界面即可

相关推荐
花酒锄作田1 天前
使用 pkgutil 实现动态插件系统
python
前端付豪1 天前
LangChain链 写一篇完美推文?用SequencialChain链接不同的组件
人工智能·python·langchain
曲幽1 天前
FastAPI实战:打造本地文生图接口,ollama+diffusers让AI绘画更听话
python·fastapi·web·cors·diffusers·lcm·ollama·dreamshaper8·txt2img
老赵全栈实战1 天前
Pydantic配置管理最佳实践(一)
python
阿尔的代码屋1 天前
[大模型实战 07] 基于 LlamaIndex ReAct 框架手搓全自动博客监控 Agent
人工智能·python
AI探索者2 天前
LangGraph StateGraph 实战:状态机聊天机器人构建指南
python
AI探索者2 天前
LangGraph 入门:构建带记忆功能的天气查询 Agent
python
FishCoderh2 天前
Python自动化办公实战:批量重命名文件,告别手动操作
python
躺平大鹅2 天前
Python函数入门详解(定义+调用+参数)
python
曲幽2 天前
我用FastAPI接ollama大模型,差点被asyncio整崩溃(附对话窗口实战)
python·fastapi·web·async·httpx·asyncio·ollama