实时数字人——DH_LIVE

前两天亲手搭建了实时对话数字人VideoChat,今天来搭建下DH_LIVE。

DH_LIVE一个实时数字人解决方案,从输入文字到数字人对口型说话用时2-3秒。

今天就来实际操作下dh_live的搭建过程。

首先贴上git地址:https://github.com/kleinlee/DH_live

然后又找到了个带webui的开源地址:https://github.com/v3ucn/DH_live_webui 含一键启动脚本。

1、先来看下自己本地的环境配置:

系统:win10

显卡:rtx 2060 super

2、创建 环境

复制代码
conda create -n dhlive python==3.10

3、创建好后激活环境,进入到项目目录

复制代码
conda activate dhlive

4、安装环境

复制代码
pip install -r requirements.txt

5、安装比较顺利,直接安装成功了,接着来试着启动下

复制代码
python api.py

报错了。如图:

这种比较好解决,直接 pip install pydub 即可。

6、接着再次执行 第五步,又报错,如图:

复制代码
pip install torchaudio

7、继续执行第五步,还报错

这是ffmpeg没有配置环境变量,配置下即可。

我的电脑--》右键--》属性--》高级系统设置--》环境变量--》系统变量--》path--》新建--》添加ffmpeg的bin路径保存即可。后台回复"ffmpeg"可获取ffmpeg文件

配置好后重启打开窗口执行ffmpeg

看到输出即为配置成功。

8、接着再执行第五步,又报错

复制代码
pip install edge_tts

9、接着执行第五步,终于成功了

经实测,效果还不错,就是口型有点不太对应。从输入到说话的间隔要看文本长度。

后台回复"DH_LIVE"可获取到一键启动的项目文件,包含checkpoints模型文件。

相关推荐
小糖学代码4 小时前
LLM系列:1.python入门:3.布尔型对象
linux·开发语言·python
Data_agent5 小时前
1688获得1688店铺详情API,python请求示例
开发语言·爬虫·python
周杰伦fans5 小时前
pycharm之gitignore设置
开发语言·python·pycharm
weixin_462446236 小时前
【原创实践】python 获取节假日列表 并保存为excel
数据库·python·excel
计算机毕设匠心工作室6 小时前
【python大数据毕设实战】全球大学排名数据可视化分析系统、Hadoop、计算机毕业设计、包括数据爬取、数据分析、数据可视化、机器学习、实战教学
后端·python·mysql
别叫我->学废了->lol在线等6 小时前
演示 hasattr 和 ** 解包操作符
开发语言·前端·python
free-elcmacom7 小时前
机器学习入门<6>BP神经网络揭秘:从自行车摔跤到吃一堑长一智的AI智慧
人工智能·python·深度学习·神经网络·机器学习
Hi202402177 小时前
如何录制浏览器播放的音频?虚拟音频线与Python采集步骤
python·音视频
programer_337 小时前
本地手动创建一个MCP(windows环境)
windows·python·ai·mcp·cherry studio
paopao_wu7 小时前
ComfyUI遇上Z-Image(1):环境部署与AI图像生成快速体验
人工智能·ai·大模型·comfyui·z-image