技术栈

人物视频

小白狮ww
18 小时前
人工智能·深度学习·机器学习·音视频·视频生成·多模态模型·人物视频
清华联合字节推出 HuMo,实现三模态协同生成人物视频如今文本生成图像与视频已不再是天方夜谭。然而,当大多数模型仍在为生成画面的清晰度与稳定性而努力时,一个更为棘手的挑战浮出水面:如何精准、一致地生成以「人物」为核心的高质量视频?对此,清华大学与字节跳动联合推出了一个名为 HuMo 的统一 HCVG 框架。它专为「创造人」而生,旨在攻克这一核心难题。
我是有底线的