小白也能学会:AI分离人声 + FFmpeg替换音轨全流程

准备工作(你需要的工具)

本教程只用两样东西:vocal-separate(本地分离人声/伴奏)和FFmpeg(把伴奏替换回视频)。 vocal-separate是本地网页操作:Windows解压后双击start.exe即可自动打开浏览器页面上传文件分离。

第一步:用vocal-separate分离伴奏

  1. 下载并解压vocal-separate到任意目录(例如E:/vocal-separate),然后双击start.exe启动。
  2. 浏览器页面打开后,把视频文件直接拖拽到上传区域,或点击上传区域选择文件,然后点"立即分离"。
  3. 选择模型时,小白优先用2stems(更简单:输出vocal和accompaniment两条音轨),等待处理完成后在页面底部下载accompaniment.wav(伴奏)。

第二步:安装FFmpeg(以Windows为例)

Windows最常见的做法是下载已编译的FFmpeg二进制包(例如gyan.dev提供的build),解压后把bin目录加入系统PATH,这样在命令行可直接运行ffmpeg。 安装完成后,打开"命令提示符/PowerShell"输入ffmpeg -version验证是否安装成功(能显示版本信息就对了)。

第三步:替换视频音轨(核心命令)

把"原视频的画面"保留,同时把"音频"换成刚刚导出的伴奏,推荐用这一条命令(把文件名按你自己的改掉): ffmpeg -i input_video.mp4 -i accompaniment.wav -map 0:v:0 -map 1:a:0 -c:v copy -c:a aac -shortest output_no_vocals.mp4

几个参数怎么理解:

  • -map 0:v:0选第1个输入(原视频)的第1条视频流,-map 1:a:0选第2个输入(伴奏)的第1条音频流。
  • -c:v copy表示视频不重新编码,速度快且画质不变;-shortest让输出时长按较短的一路对齐,避免"黑屏但还在放音频"等情况。

如果新音频和视频时长不一致,可以先裁剪音频到视频时长再替换,例如:
ffmpeg -i accompaniment.wav -t 00:01:30 trimmed.wav,再用trimmed.wav去替换。

相关推荐
DogDaoDao4 分钟前
【GitHub】OpenClaw:开源个人AI助手的新标杆
人工智能·深度学习·开源·大模型·github·ai编程·opeclaw
一点一木8 小时前
🚀 2026 年 4 月 GitHub 十大热门项目排行榜 🔥
人工智能·github
宝桥南山10 小时前
AI - 在命令行中尝试一下ACP(Agent Client Protocol)通信
microsoft·微软·github·aigc·copilot
拾贰_C13 小时前
【Github | GitHub Copilot | 学生认证】 GitHub Copilot学生如何认证
github
旅之灵夫14 小时前
【GitHub项目推荐--OpenArm:开源7自由度仿人机械臂平台】
github
一乐小哥15 小时前
坚持迭代一个 Chrome 插件半年后,我的同事问我:"这不是 Chrome 自带的功能吗?"
chrome·github·ai编程
Smilezyl15 小时前
一个独立开发者,靠一份 markdown 驱动 Claude Code, 用 20 天跑通 9 个包的 monorepo 工程
前端·人工智能·github
峰向AI15 小时前
做小红书、画信息图、动漫图:这个skill太实用了
github
Cosolar15 小时前
封神级 TTS!VoxCPM2 凭连续表征,玩转多语言合成 + 创意音色 + 无损声纹克隆
人工智能·llm·github
码流怪侠15 小时前
【GitHub】andrej-karpathy-skills:让 AI 编程助手告别三大通病
人工智能·程序员·github