在Windows系统上部署 CosyVoice 2

本文参考 https://github.com/FunAudioLLM/CosyVoice 的安装方法,但是解决了一些安装、运行过程中的错误:

1、使用以下命令克隆 CosyVoice 代码仓库

bash 复制代码
git clone --recursive https://github.com/FunAudioLLM/CosyVoice.git
# 如果因网络问题未能成功克隆子模块,请重复运行以下命令,直至成功。
cd CosyVoice
git submodule update --init --recursive

2、安装 Anaconda

访问Anaconda官网下载最新版,并根据指示安装。

3、使用以下命令创建 Conda 环境

bash 复制代码
conda create -n cosyvoice -y python=3.10
conda activate cosyvoice
pip install -r requirements.txt -i https://mirrors.aliyun.com/pypi/simple/ --trusted-host=mirrors.aliyun.com

4、下载模型

方法一:进入到 CosyVoice 代码目录,使用 git 命令下载模型:

bash 复制代码
# git模型下载,请确保已安装git lfs
mkdir -p pretrained_models
git clone https://www.modelscope.cn/iic/CosyVoice2-0.5B.git pretrained_models/CosyVoice2-0.5B

方法二:使用Python代码下载

python 复制代码
from modelscope import snapshot_download
snapshot_download('iic/CosyVoice2-0.5B', local_dir='pretrained_models/CosyVoice2-0.5B')

5、启动webui

执行以下命令:

bash 复制代码
python webui.py --port 50000 --model_dir pretrained_models/CosyVoice2-0.5B

如果一切正常,在浏览器中打开 http://127.0.0.1:50000/ 可以看到以下界面:

6、可能遇到的问题

6.1、DLL load failed while importing _kaldifst: 动态链接库(DLL)初始化例程失败。

如出现以下问题:

将 cosyvoice\cli\frontend.py 代码中的以下代码:

python 复制代码
try:
    import ttsfrd
    use_ttsfrd = True
except ImportError:
    print("failed to import ttsfrd, use wetext instead")
    from wetext import Normalizer as ZhNormalizer
    from wetext import Normalizer as EnNormalizer
    use_ttsfrd = False

拷贝到 的最前面,如下图所示:

6.2、FileNotFoundError: WinError 2 系统找不到指定的文件

如果出现以下错误:

bash 复制代码
File "...\pydub\utils.py", line 274, in mediainfo_json
    res = Popen(command, stdin=stdin_parameter, stdout=PIPE, stderr=PIPE)
...
FileNotFoundError: [WinError 2] 系统找不到指定的文件。

如图:

说明系统缺少 ffmpeg 库,打开 https://www.gyan.dev/ffmpeg/builds/ 下载以下文件:

将下载文件解压到 D:\ffmpeg, 然后将 D:\ffmpeg\bin 添加到系统环境变量的 Path 变量中,重新启动终端,运行以下命令,查看 ffmpeg 是否安装成功:

bash 复制代码
ffmpeg -version

然后在参考前面 【5、启动webui】 重新启动。

相关推荐
Dfreedom.13 小时前
Windows、虚拟机、开发板组网通信原理及调试通联步骤
人工智能·windows·部署·边缘计算·开发板·模型加速
三无推导18 小时前
ComfyUI 安装部署教程:Windows 下快速搭建可视化 AI 绘图工作流,零基础也能跑通
人工智能·pytorch·windows·stable diffusion·aigc·ai绘画·持续部署
nnsix21 小时前
PS【PhotoShop】实现拷贝到Windows粘贴板上
windows
сокол21 小时前
【网安-Web渗透测试-免杀系列】内存免杀(无文件落地)
windows·网络安全
玖釉-21 小时前
二叉树基础详解:TreeNode、buildTree、deleteTree 与 printTree 的实现原理(C++)
c++·windows·算法
心之所向,自强不息21 小时前
# Unity MCP + Codex CLI 完整教程(Windows)
windows·unity·游戏引擎
特立独行的猫a21 小时前
Fast DDS Monitor Windows x64 从源码编译安装完全教程
windows·monitor·dds·fastdds·fastddsmonitor
慵懒的猫mi1 天前
deepin 25部署x11vnc+xrdp,实现vnc和mstsc双重访问
linux·windows·开源软件·deepin
神仙别闹1 天前
基于C语言 实现 Windows PE 文件解析
c语言·windows·microsoft
kebeiovo1 天前
Codex在Windows安装配置指南
windows