实时数字人——DH_LIVE

前两天亲手搭建了实时对话数字人VideoChat,今天来搭建下DH_LIVE。

DH_LIVE一个实时数字人解决方案,从输入文字到数字人对口型说话用时2-3秒。

今天就来实际操作下dh_live的搭建过程。

首先贴上git地址:https://github.com/kleinlee/DH_live

然后又找到了个带webui的开源地址:https://github.com/v3ucn/DH_live_webui 含一键启动脚本。

1、先来看下自己本地的环境配置:

系统:win10

显卡:rtx 2060 super

2、创建 环境

复制代码
conda create -n dhlive python==3.10

3、创建好后激活环境,进入到项目目录

复制代码
conda activate dhlive

4、安装环境

复制代码
pip install -r requirements.txt

5、安装比较顺利,直接安装成功了,接着来试着启动下

复制代码
python api.py

报错了。如图:

这种比较好解决,直接 pip install pydub 即可。

6、接着再次执行 第五步,又报错,如图:

复制代码
pip install torchaudio

7、继续执行第五步,还报错

这是ffmpeg没有配置环境变量,配置下即可。

我的电脑--》右键--》属性--》高级系统设置--》环境变量--》系统变量--》path--》新建--》添加ffmpeg的bin路径保存即可。后台回复"ffmpeg"可获取ffmpeg文件

配置好后重启打开窗口执行ffmpeg

看到输出即为配置成功。

8、接着再执行第五步,又报错

复制代码
pip install edge_tts

9、接着执行第五步,终于成功了

经实测,效果还不错,就是口型有点不太对应。从输入到说话的间隔要看文本长度。

后台回复"DH_LIVE"可获取到一键启动的项目文件,包含checkpoints模型文件。

相关推荐
阿_旭2 小时前
基于深度学习的甲状腺结节智能检测分割与诊断系统【python源码+Pyqt5界面+数据集+训练代码】
人工智能·python·深度学习·甲状腺结节检测
woshihonghonga2 小时前
PyTorch矩阵乘法函数区别解析与矩阵高级索引说明——《动手学深度学习》3.6.3、3.6.4和3.6.5 (P79)
人工智能·pytorch·python·深度学习·jupyter·矩阵
AI云原生3 小时前
云原生系列Bug修复:Docker镜像无法启动的终极解决方案与排查思路
运维·服务器·python·docker·云原生·容器·bug
万粉变现经纪人5 小时前
如何解决 pip install -r requirements.txt 私有索引未设为 trusted-host 导致拒绝 问题
开发语言·python·scrapy·flask·beautifulsoup·pandas·pip
查士丁尼·绵6 小时前
笔试-九宫格三阶积幻方
python·九宫格·三阶积幻方
l1t8 小时前
DeepSeek辅助利用搬移底层xml实现快速编辑xlsx文件的python程序
xml·开发语言·python·xlsx
大飞记Python8 小时前
部门管理|“编辑部门”功能实现(Django5零基础Web平台)
前端·数据库·python·django
查士丁尼·绵10 小时前
笔试-羊狼过河
python
KG_LLM图谱增强大模型10 小时前
整合知识图谱与大语言模型:下一代药物发现的革命性技术
大模型·知识图谱·graphrag·医药·知识图谱增强大模型
摸鱼的老谭10 小时前
构建Agent该选Python还是Java ?
java·python·agent