移动端数字人 Ultralight-Digital-Human 算法笔记

目录

[Ultralight-Digital-Human 数字人算法](#Ultralight-Digital-Human 数字人算法)

视音频对齐同步模型:SyncNet

[MNN TaoAvatar 无网手机运行数字人开源](#MNN TaoAvatar 无网手机运行数字人开源)

[metahuman-stream 改名为livetalking](#metahuman-stream 改名为livetalking)


Ultralight-Digital-Human 数字人算法

参考资料

项目代码:https://github.com/anliyuan/Ultralight-Digital-Human

人脸检测(SCRFD):Sample and Computation Redistribution for Efficient Face Detection

https://arxiv.org/pdf/2105.04714

https://zhuanlan.zhihu.com/p/388842796

模型:scrfd_2.5g_kps.onnx

人脸关键点检测(PFLD):A Practical Facial Landmark Detector

https://arxiv.org/pdf/1902.10859

https://zhuanlan.zhihu.com/p/65557195

模型:checkpoint_epoch_335.pth.tar (实际输出了110个坐标点)

音频特征提取,两种方案

HuBert:

WeNet:

视音频对齐同步模型:SyncNet

项目地址:https://github.com/joonson/sync

https://github.com/anliyuan/Ultralight-Digital-Human

首先我们需要提取音频特征,我用了两个不同的特征提取起,分别是wenet和hubert,感谢他们。

When you using wenet, you neet to ensure that your video frame rate is 20, and for hubert,your video frame rate should be 25.

如果你选择使用wenet的话,你必须保证你视频的帧率是20fps,如果选择hubert,视频帧率必须是25fps。

In my experiments, hubert performs better, but wenet is faster and can run in real time on mobile devices.

在我的实验中,hubert的效果更好,但是wenet速度更快,可以在移动端上实时运行

And other steps are in data_utils/process.py, you just run it like this.

其他步骤都写在data_utils/process.py里面了,没什么特别要注意的。

复制代码
cd data_utils
python process.py YOUR_VIDEO_PATH --asr hubert

MNN TaoAvatar 无网手机运行数字人开源

metahuman-stream 改名为livetalking

为避免与3d数字人混淆,原项目metahuman-stream改名为livetalking,原有链接地址继续可用

相关推荐
辰海Coding5 小时前
MiniSpring框架学习笔记-解决循环依赖的简化IoC容器
笔记·学习
晓梦林5 小时前
cp520靶场学习笔记
android·笔记·学习
心中有国也有家6 小时前
cann-recipes-infer:昇腾 NPU 推理的“菜谱集合”
经验分享·笔记·学习·算法
玄米乌龙茶1236 小时前
LLM成长笔记(三):API 开发基础
笔记
Upsy-Daisy6 小时前
AI Agent 项目学习笔记(八):Tool Calling 工具调用机制总览
人工智能·笔记·学习
科技那些事儿8 小时前
实时洞察,视觉赋能:国内情绪识别API公司推荐及计算机视觉流派深度解析
人工智能·计算机视觉
LuminousCPP8 小时前
数据结构 - 线性表第四篇:C 语言通讯录优化升级全记录(踩坑 + 思考)
c语言·开发语言·数据结构·经验分享·笔记·学习
一只机电自动化菜鸟9 小时前
一建机电备考笔记(40) 建筑机电施工—排水管道施工(含考频+题型)
经验分享·笔记·学习·职场和发展·课程设计
你干嘛?哎哟9 小时前
4月工作笔记
笔记
tom02189 小时前
软考中级《嵌入式系统设计师》全套备考资料(真题 + 教材 + 笔记)
笔记·嵌入式·软考·自学·电子技术·电子资料·变成