在Windows系统上部署 CosyVoice 2

本文参考 https://github.com/FunAudioLLM/CosyVoice 的安装方法,但是解决了一些安装、运行过程中的错误:

1、使用以下命令克隆 CosyVoice 代码仓库

bash 复制代码
git clone --recursive https://github.com/FunAudioLLM/CosyVoice.git
# 如果因网络问题未能成功克隆子模块,请重复运行以下命令,直至成功。
cd CosyVoice
git submodule update --init --recursive

2、安装 Anaconda

访问Anaconda官网下载最新版,并根据指示安装。

3、使用以下命令创建 Conda 环境

bash 复制代码
conda create -n cosyvoice -y python=3.10
conda activate cosyvoice
pip install -r requirements.txt -i https://mirrors.aliyun.com/pypi/simple/ --trusted-host=mirrors.aliyun.com

4、下载模型

方法一:进入到 CosyVoice 代码目录,使用 git 命令下载模型:

bash 复制代码
# git模型下载,请确保已安装git lfs
mkdir -p pretrained_models
git clone https://www.modelscope.cn/iic/CosyVoice2-0.5B.git pretrained_models/CosyVoice2-0.5B

方法二:使用Python代码下载

python 复制代码
from modelscope import snapshot_download
snapshot_download('iic/CosyVoice2-0.5B', local_dir='pretrained_models/CosyVoice2-0.5B')

5、启动webui

执行以下命令:

bash 复制代码
python webui.py --port 50000 --model_dir pretrained_models/CosyVoice2-0.5B

如果一切正常,在浏览器中打开 http://127.0.0.1:50000/ 可以看到以下界面:

6、可能遇到的问题

6.1、DLL load failed while importing _kaldifst: 动态链接库(DLL)初始化例程失败。

如出现以下问题:

将 cosyvoice\cli\frontend.py 代码中的以下代码:

python 复制代码
try:
    import ttsfrd
    use_ttsfrd = True
except ImportError:
    print("failed to import ttsfrd, use wetext instead")
    from wetext import Normalizer as ZhNormalizer
    from wetext import Normalizer as EnNormalizer
    use_ttsfrd = False

拷贝到 的最前面,如下图所示:

6.2、FileNotFoundError: [WinError 2] 系统找不到指定的文件

如果出现以下错误:

bash 复制代码
File "...\pydub\utils.py", line 274, in mediainfo_json
    res = Popen(command, stdin=stdin_parameter, stdout=PIPE, stderr=PIPE)
...
FileNotFoundError: [WinError 2] 系统找不到指定的文件。

如图:

说明系统缺少 ffmpeg 库,打开 https://www.gyan.dev/ffmpeg/builds/ 下载以下文件:

将下载文件解压到 D:\ffmpeg, 然后将 D:\ffmpeg\bin 添加到系统环境变量的 Path 变量中,重新启动终端,运行以下命令,查看 ffmpeg 是否安装成功:

bash 复制代码
ffmpeg -version

然后在参考前面 【5、启动webui】 重新启动。

相关推荐
川川菜鸟6 小时前
Claude Code 安装与配置完整指南(Windows)
windows
PfCoder7 小时前
WinForm真入门(23)---PictureBox 控件详细用法
开发语言·windows·c#·winform
Mr_Xuhhh8 小时前
MySQL表的增删改查(CRUD)操作详解
数据库·windows
老姚---老姚8 小时前
在windows下编译go语言编写的dll库
开发语言·windows·golang
love530love9 小时前
技术复盘:llama-cpp-python CUDA 编译实战 (Windows)
人工智能·windows·python·llama·aitechlab·cpp-python·cuda版本
开开心心就好12 小时前
键盘改键工具免安装,自定义键位屏蔽误触
java·网络·windows·随机森林·计算机外设·电脑·excel
2601_9495328412 小时前
Psello HTML Template: A Developer‘s Deep-Dive Review and Guide - Download Free
前端·windows·html·seo·wordpress·gpl
软件资深者14 小时前
USB存储设备管理工具 启用或者禁用+usb修复
windows·microsoft·计算机外设·系统修复
失眠的稻草人25914 小时前
【windows】注入--BHO机制
windows
XLYcmy14 小时前
一个用于统计文本文件行数的Python实用工具脚本
开发语言·数据结构·windows·python·开发工具·数据处理·源代码