MacOS 运行CosyVoice

CosyVoic主要特点:

1、支持中文、英文、上海话、天津话、四川话等方言。语音非常自然。

2、支持3秒语音零样本克隆,效果非常好。

3、克隆时间比较长(取决于GPU性能,使用H20以满足低延迟输出),L4 克隆默认文本需要10秒。

MacOS上运行比较简单,直接使用docker即可,虽然是docker是 AMD64版本非ARM64版本,但在容器中仍然可以使用,但性能会有所损失,相当于直接用的CPU,也没有使用MPS加速。

运行服务命令:

docker run --name cosyvoice -p 50000:50000 -d bobui/cosyvoice:h20_v2.20250801 /bin/bash -c "cd /opt/CosyVoice/CosyVoice/runtime/python/grpc && python3 server.py --port 50000 --model_dir iic/CosyVoice-300M"

以上bash命令会自动下载300M模型,并以grpc接口运行。

若想使用CosyVoice2-0.5B,只需要修改模型名称后运行即可。如:

docker run --name cosyvoice -p 50000:50000 -d bobui/cosyvoice:h20_v2.20250801 /bin/bash -c "cd /opt/CosyVoice/CosyVoice/runtime/python/grpc && python3 server.py --port 50000 --model_dir iic/CosyVoice2-0.5M"

若想使用fastapi,只需要将grpc修改为fastapi即可。

零样本测试命令:

cd /opt/CosyVoice/CosyVoice/runtime/python/grpc

python client.py --mode zero_shot

说明:默认使用asset/zero_shot_prompt.wav 作为参考声音

输出默认文件名称为:demo.wav

若要指定参考声音:--prompt_wav "你的参考声音.wav"

若要指定克隆文本:--tts_text "你需要克隆的文本内容"

最大的坑:

若改变默认的参考声音,则克隆出的声音与克隆文本完全不一致,好像模型自由发挥了吗?

这里需要同时指定--prompt_text 这个参数才可以。

相关推荐
Allen Su1 小时前
【Mac 教程系列第 20 篇】macOS 鼠须管(Squirrel)皮肤大全(持续更新)
macos·rime·squirrel·rime 输入法皮肤大全
LinMin_Rik4 小时前
Mac上获取私钥证书P12文件(也可以给win11的HbuilderX使用)
macos
音视频牛哥7 小时前
macOS如何实现RTSP/RTMP低延迟播放? SmartMacPlayer技术实战探究
macos·大牛直播sdk·mac rtsp播放器·mac rtmp·mac rtmp播放器·mac平台播放rtsp·mac平台播放rtmp
一杯奶茶¥8 小时前
苹果系统可引导镜像 macOS 原版可引导镜像
macos
BugShare9 小时前
Mac 上原生开发的开源免费、尽享丝滑数据库工具
数据库·macos·开源
Soari9 小时前
开源项目apple/container 解析:Apple 官方推出的 macOS 原生容器运行工具
macos·开源
糖果店的幽灵9 小时前
Mac 安装 Codex 并使用 CC Switch 中转教程
macos
万物得其道者成9 小时前
【2026最新】Mac版OpenAI Codex 一键汉化教程
macos
AI行业学习1 天前
CC‑Switch v3.16.1 免费下载(Windows+macOS+Linux)、使用方法【2026.6.11】
linux·开发语言·windows·python·macos·前端框架·html
一个人旅程~1 天前
如何进行win11右键菜单优化(poweshell命令行与bat自动脚本方式)
windows·经验分享·macos·电脑