CVPR 2026 | 复旦开源首个端到端多模态矢量动画生成框架OmniLottie:UI动效革命,文本/图像一键转Lottie动画!

在UI/UX设计和前端开发领域,制作高质量的交互动画(Motion Design)一直是个痛点:设计师需要在After Effects中 painstakingly 绘制关键帧,开发人员则需要反复调整代码以还原效果,而最终的Lottie文件往往体积大、兼容性差。 由复旦OpenVGLab团队推出的OmniLottie提出了首个全能型多模态Lottie动画生成模型。它打破了传统工作流的壁垒,支持**"文本生成动画"、"图像生成动画"、"草图转动画"甚至"视频风格迁移为Lottie"**。OmniLottie 不仅能生成流畅的矢量动画,还能严格控制文件大小和代码结构,直接输出可用的 .json 文件。这意味着,未来你只需输入一句描述或上传一张静态图,就能立刻获得一个专业级的UI动效!

相关链接

论文介绍

OmniLottie旨在解决AI动画生成领域的三大局限:文件体积大、无法无损缩放、难以编辑。通过引入Lottie Tokenizer,OmniLottie将Lottie JSON文件转化为结构化的命令和参数序列,实现了10倍的数据压缩比,显著降低了模型计算负担,同时确保了动画表征的零损耗与完整表达能力。此外,OmniLottie还开源了MMLottie-2M数据集,这是目前业界规模最大的200万量级多模态矢量动画数据集,为矢量动画生成领域的研究提供了坚实的数据支撑。

方法概述

Lottie Tokenizer设计

OmniLottie引入了精心设计的Lottie Tokenizer,将Lottie JSON文件中的形状、动画函数和控制参数转化为结构化的命令和参数序列。 通过参数化建模,实现了高效的数据压缩和模型计算负担的降低,同时确保了动画的完整表达能力。

多模态指令跟随

OmniLottie基于预训练的视觉语言模型(VLM),能够跟随多模态(文本、图像、视频)指令生成高质量的矢量动画。 通过引入任务token和显式指令解析机制,实现了对复杂多模态指令的准确理解和执行。

MMLottie-2M数据集构建

OmniLottie团队开源了MMLottie-2M数据集,包含200万量级的专业设计矢量动画,并配有文本和视觉注释。 该数据集通过统一的数据格式和评估标准,推动了矢量动画生成领域的标准化进程,为后续研究提供了丰富的资源。

高效训练与推理

OmniLottie通过大规模预训练和微调策略,实现了对多模态指令的高效跟随和动画生成。 在推理阶段,OmniLottie支持快速生成高质量矢量动画,满足了实时应用的需求。

实验

动画生成质量实验

OmniLottie在多个基准测试上展示了其生成高质量矢量动画的能力,生成的动画在视觉效果上逼真且语义对齐度高。 用户研究表明,OmniLottie生成的动画在创意性和实用性方面均获得了高度评价。

数据压缩与计算效率实验

Lottie Tokenizer实现了10倍的数据压缩比,显著降低了模型计算负担和存储需求。 在保持动画质量的同时,OmniLottie的推理速度比传统方法有了显著提升。

多模态指令跟随实验

  • OmniLottie能够准确理解并执行复杂的多模态指令,生成符合用户期望的矢量动画。

  • 在文本、图像、视频等多种输入模态下,OmniLottie均展示了出色的指令跟随能力和动画生成效果。

相关推荐
禹笑笑-AI食用指南2 小时前
AI 团队协作下的工作日志系统:痛点、场景与技术解决方案
人工智能
新缸中之脑2 小时前
用Gemma 4构建自托管OCR
人工智能·ocr
ai_xiaogui2 小时前
凌晨3点的重构局:从遗漏“用户中心”看AI客户端前后端分离架构的深水区
人工智能·aistarter·panelai·ai客户端架构设计·桌面端前后端分离·本地大模型api接入·独立开发者踩坑实录
不才小强2 小时前
CUDA编程与API详解
人工智能
探物 AI2 小时前
虾破苍穹(一):RTX 3060 养一只本地“呆呆”龙虾 [特殊字符]
人工智能·ai编程
俊哥V2 小时前
每日 AI 研究简报 · 2026-04-12
人工智能·ai
拥抱AGI2 小时前
Qwen3.5开源矩阵震撼发布!从0.8B到397B,不同规模模型性能、显存、速度深度对比与选型指南来了!
人工智能·学习·程序员·开源·大模型·大模型训练·qwen3.5
哈喽天空2 小时前
win10原生安装openclaw
人工智能