这个小软件是干嘛的捏?(老用户都知道,这个仅仅是升级版,并且修复了一点bug)
简单说,就是把多个音频(WAV、MP3)混在一起,合成一个 WAV 文件。
比如你有一首伴奏,还有一段人声,想合在一起做翻唱;或者你录了好几轨音频,要混成一首完整的歌 --- 这工具就是干这个的。
-
文件类型不同:伴奏是 MP3,人声是 WAV,直接拖进去就行,不用事先转格式。
-
采样率不一样:不用操心 44.1k、48k 这些,程序会自动重采样(线性插值),保证合成出来的声音速度和音准正常。
-
开头对不齐:比如人声比伴奏晚开始了 0.3 秒,每轨可以单独设置"起始偏移"(负数往前移,正数往后移),把时间轴对齐。
-
结尾长短不一:可以选择"截断对齐"(以最短的为准)或"延长对齐"(以最长的为准),还能额外统一加一段静音(比如结尾需要留 0.5 秒空白)。
-
音量大小不合适:每轨独立调音量(0.0 ~ 随便,但太大会爆音,程序会自动削顶)。
怎么用呢?
先上图:

-
拖文件:直接把 WAV/MP3 拖进窗口,或点击每行的"文件路径"标签浏览。
-
调参数:
-
音量:比如人声 1.1,伴奏 1.0。
-
偏移:单位秒,正数切掉开头,负数补静音。
-
对齐模式:截断(短轨决定长度)或延长(长轨决定长度)。
-
结尾补偿:在最后统一加几秒静音。
-
-
输出:指定一个结果文件名(默认生成 WAV,16 位立体声)。
-
点"合成混音wav":进度条走完就 OK。
稍微提一下技术相关哈
-
输入:PCM WAV(8/16/24/32 位)和 MP3(解码为 16 位 PCM)。
-
输出:16 位 立体声 WAV,采样率以第一个加载的文件为准。
-
重采样:线性插值,够用且快。
-
偏移/补偿:基于时间轴(秒),自动延长或裁剪,超出部分补静音。
-
内存消耗:整个音频会一次性加载到内存,太大的文件(比如几十分钟的 MP3)会占用较多 RAM,但对大多数翻唱来说没问题。
适合谁呢?
- 需要快速把几段音频拼成一条,但又不想打开专业 DAW 的懒人。简单直接...
这工具是我自己平时做视频配音、翻唱混音时一点点改出来的,遇到过采样率不匹配、开头错位、结尾缺一段等各种烦事,所以就顺手集成了这些功能。代码里有些地方可能不够优雅(毕竟一开始只是写给自己用),但核心功能是稳定的。如果你也遇到类似烦恼,希望它能帮上忙。