技术栈
口型驱动
示申○言舌
1 天前
数字人
·
实时问答
·
全模态
·
口型驱动
实时问答数字人
现在数字人挺火的,这两天研究了一阵子,先将所得记录和总结一下,如果这篇文章能够帮到你,那就更好了。 目前数字人大概分为两种,第一种是非实时的,本质上就是视频生成,有文生视频、图生视频还有参考视频生视频,这种比较适合直播,还有做视频的UP主,这种在我看来不太符合我的研究方向,懒得研究它。 另一种,就是实时性的了,本文重点研究这种类型的。
我是有底线的