技术栈
vace
yang_daxia
3 小时前
论文阅读
·
vace
论文阅读VACE: All-in-One Video Creation and Editing
所有的视频相关任务可以分为4类 文本生视频 参考图片生视频 视频生视频 视频+mask生视频对上述4个任务,制定一个统一的输入范式。text,frame以及mask。 对于每一个不同的任务,text不用变,主要变化F以及M。对于参考图+视频,无非是多了l个参考图的输入。mask对应设置如下表所示。 这样就统一了不同类型任务的输入。