CVPR 2026 | 复旦开源首个端到端多模态矢量动画生成框架OmniLottie:UI动效革命,文本/图像一键转Lottie动画!

在UI/UX设计和前端开发领域,制作高质量的交互动画(Motion Design)一直是个痛点:设计师需要在After Effects中 painstakingly 绘制关键帧,开发人员则需要反复调整代码以还原效果,而最终的Lottie文件往往体积大、兼容性差。 由复旦OpenVGLab团队推出的OmniLottie提出了首个全能型多模态Lottie动画生成模型。它打破了传统工作流的壁垒,支持**"文本生成动画"、"图像生成动画"、"草图转动画"甚至"视频风格迁移为Lottie"**。OmniLottie 不仅能生成流畅的矢量动画,还能严格控制文件大小和代码结构,直接输出可用的 .json 文件。这意味着,未来你只需输入一句描述或上传一张静态图,就能立刻获得一个专业级的UI动效!

相关链接

论文介绍

OmniLottie旨在解决AI动画生成领域的三大局限:文件体积大、无法无损缩放、难以编辑。通过引入Lottie Tokenizer,OmniLottie将Lottie JSON文件转化为结构化的命令和参数序列,实现了10倍的数据压缩比,显著降低了模型计算负担,同时确保了动画表征的零损耗与完整表达能力。此外,OmniLottie还开源了MMLottie-2M数据集,这是目前业界规模最大的200万量级多模态矢量动画数据集,为矢量动画生成领域的研究提供了坚实的数据支撑。

方法概述

Lottie Tokenizer设计

OmniLottie引入了精心设计的Lottie Tokenizer,将Lottie JSON文件中的形状、动画函数和控制参数转化为结构化的命令和参数序列。 通过参数化建模,实现了高效的数据压缩和模型计算负担的降低,同时确保了动画的完整表达能力。

多模态指令跟随

OmniLottie基于预训练的视觉语言模型(VLM),能够跟随多模态(文本、图像、视频)指令生成高质量的矢量动画。 通过引入任务token和显式指令解析机制,实现了对复杂多模态指令的准确理解和执行。

MMLottie-2M数据集构建

OmniLottie团队开源了MMLottie-2M数据集,包含200万量级的专业设计矢量动画,并配有文本和视觉注释。 该数据集通过统一的数据格式和评估标准,推动了矢量动画生成领域的标准化进程,为后续研究提供了丰富的资源。

高效训练与推理

OmniLottie通过大规模预训练和微调策略,实现了对多模态指令的高效跟随和动画生成。 在推理阶段,OmniLottie支持快速生成高质量矢量动画,满足了实时应用的需求。

实验

动画生成质量实验

OmniLottie在多个基准测试上展示了其生成高质量矢量动画的能力,生成的动画在视觉效果上逼真且语义对齐度高。 用户研究表明,OmniLottie生成的动画在创意性和实用性方面均获得了高度评价。

数据压缩与计算效率实验

Lottie Tokenizer实现了10倍的数据压缩比,显著降低了模型计算负担和存储需求。 在保持动画质量的同时,OmniLottie的推理速度比传统方法有了显著提升。

多模态指令跟随实验

  • OmniLottie能够准确理解并执行复杂的多模态指令,生成符合用户期望的矢量动画。

  • 在文本、图像、视频等多种输入模态下,OmniLottie均展示了出色的指令跟随能力和动画生成效果。

相关推荐
科技小花8 分钟前
全球化深水区,数据治理成为企业出海 “核心竞争力”
大数据·数据库·人工智能·数据治理·数据中台·全球化
zhuiyisuifeng1 小时前
2026前瞻:GPTimage2镜像官网或将颠覆视觉创作
人工智能·gpt
徐健峰1 小时前
GPT-image-2 热门玩法实战(一):AI 看手相 — 一张手掌照片生成专业手相分析图
人工智能·gpt
weixin_370976351 小时前
AI的终极赛跑:进入AGI,还是泡沫破灭?
大数据·人工智能·agi
Slow菜鸟1 小时前
AI学习篇(五) | awesome-design-md 使用说明
人工智能·学习
冬奇Lab2 小时前
RAG 系列(五):Embedding 模型——语义理解的核心
人工智能·llm·aigc
深小乐2 小时前
AI 周刊【2026.04.27-05.03】:Anthropic 9000亿美元估值、英伟达死磕智能体、中央重磅定调AI
人工智能
码点滴2 小时前
什么时候用 DeepSeek V4,而不是 GPT-5/Claude/Gemini?
人工智能·gpt·架构·大模型·deepseek
狐狐生风2 小时前
LangChain 向量存储:Chroma、FAISS
人工智能·python·学习·langchain·faiss·agentai
波动几何2 小时前
CDA架构代码工坊技能cda-code-lab
人工智能