在Windows系统上部署 CosyVoice 2

本文参考 https://github.com/FunAudioLLM/CosyVoice 的安装方法,但是解决了一些安装、运行过程中的错误:

1、使用以下命令克隆 CosyVoice 代码仓库

bash 复制代码
git clone --recursive https://github.com/FunAudioLLM/CosyVoice.git
# 如果因网络问题未能成功克隆子模块,请重复运行以下命令,直至成功。
cd CosyVoice
git submodule update --init --recursive

2、安装 Anaconda

访问Anaconda官网下载最新版,并根据指示安装。

3、使用以下命令创建 Conda 环境

bash 复制代码
conda create -n cosyvoice -y python=3.10
conda activate cosyvoice
pip install -r requirements.txt -i https://mirrors.aliyun.com/pypi/simple/ --trusted-host=mirrors.aliyun.com

4、下载模型

方法一:进入到 CosyVoice 代码目录,使用 git 命令下载模型:

bash 复制代码
# git模型下载,请确保已安装git lfs
mkdir -p pretrained_models
git clone https://www.modelscope.cn/iic/CosyVoice2-0.5B.git pretrained_models/CosyVoice2-0.5B

方法二:使用Python代码下载

python 复制代码
from modelscope import snapshot_download
snapshot_download('iic/CosyVoice2-0.5B', local_dir='pretrained_models/CosyVoice2-0.5B')

5、启动webui

执行以下命令:

bash 复制代码
python webui.py --port 50000 --model_dir pretrained_models/CosyVoice2-0.5B

如果一切正常,在浏览器中打开 http://127.0.0.1:50000/ 可以看到以下界面:

6、可能遇到的问题

6.1、DLL load failed while importing _kaldifst: 动态链接库(DLL)初始化例程失败。

如出现以下问题:

将 cosyvoice\cli\frontend.py 代码中的以下代码:

python 复制代码
try:
    import ttsfrd
    use_ttsfrd = True
except ImportError:
    print("failed to import ttsfrd, use wetext instead")
    from wetext import Normalizer as ZhNormalizer
    from wetext import Normalizer as EnNormalizer
    use_ttsfrd = False

拷贝到 的最前面,如下图所示:

6.2、FileNotFoundError: [WinError 2] 系统找不到指定的文件

如果出现以下错误:

bash 复制代码
File "...\pydub\utils.py", line 274, in mediainfo_json
    res = Popen(command, stdin=stdin_parameter, stdout=PIPE, stderr=PIPE)
...
FileNotFoundError: [WinError 2] 系统找不到指定的文件。

如图:

说明系统缺少 ffmpeg 库,打开 https://www.gyan.dev/ffmpeg/builds/ 下载以下文件:

将下载文件解压到 D:\ffmpeg, 然后将 D:\ffmpeg\bin 添加到系统环境变量的 Path 变量中,重新启动终端,运行以下命令,查看 ffmpeg 是否安装成功:

bash 复制代码
ffmpeg -version

然后在参考前面 【5、启动webui】 重新启动。

相关推荐
凯子坚持 c19 小时前
CANN 性能剖析实战:从原始事件到交互式火焰图
windows·microsoft
开开心心就好19 小时前
发票合并打印工具,多页布局设置实时预览
linux·运维·服务器·windows·pdf·harmonyos·1024程序员节
獨枭19 小时前
PyCharm 跑通 SAM 全流程实战
windows
仙剑魔尊重楼20 小时前
音乐制作电子软件FL Studio2025.2.4.5242中文版新功能介绍
windows·音频·录屏·音乐·fl studio
PHP小志21 小时前
Windows 服务器怎么修改密码和用户名?账户被系统锁定如何解锁
windows
专注VB编程开发20年1 天前
vb.net datatable新增数据时改用数组缓存
java·linux·windows
仙剑魔尊重楼1 天前
专业音乐制作软件fl Studio 2025.2.4.5242中文版新功能
windows·音乐·fl studio
rjc_lihui1 天前
Windows 运程共享linux系统的方法
windows
失忆爆表症1 天前
01_项目搭建指南:从零开始的 Windows 开发环境配置
windows·postgresql·fastapi·milvus
阿昭L1 天前
C++异常处理机制反汇编(三):32位下的异常结构分析
c++·windows·逆向工程