技术栈
人物视频
小白狮ww
18 小时前
人工智能
·
深度学习
·
机器学习
·
音视频
·
视频生成
·
多模态模型
·
人物视频
清华联合字节推出 HuMo,实现三模态协同生成人物视频
如今文本生成图像与视频已不再是天方夜谭。然而,当大多数模型仍在为生成画面的清晰度与稳定性而努力时,一个更为棘手的挑战浮出水面:如何精准、一致地生成以「人物」为核心的高质量视频?对此,清华大学与字节跳动联合推出了一个名为 HuMo 的统一 HCVG 框架。它专为「创造人」而生,旨在攻克这一核心难题。
我是有底线的