核心观点 :AI 设计类产品的两大核心壁垒------矢量渲染引擎是底座,结构化转换是灵魂。AI 大模型本身不是护城河。
1. 核心结论(先说结论)
arduino
┌─────────────────────────────────────────────────────┐
│ 用户感知层(产品体验) │
├─────────────────────────────────────────────────────┤
│ 结构化转换层(灵魂) │ ← 决定"好不好用"
│ - 混沌 AI 输出 → 语义化图层树 │
│ - 静态布局 → 响应式约束 │
│ - 位图 → 可编辑矢量 │
├─────────────────────────────────────────────────────┤
│ 矢量渲染引擎(底座) │ ← 决定"能不能做"
│ - 路径渲染 / 图层混合 / 60fps 性能 │
│ - 所有上层能力的物理承载 │
├─────────────────────────────────────────────────────┤
│ AI 生成模型(水电煤) │ ← 可购买,非壁垒
│ - Sora / Midjourney / Veo 等 │
└─────────────────────────────────────────────────────┘
一句话总结:
铁打的引擎,流水的模型。 用户住的是房子(渲染引擎),不是水电煤(AI 模型)。而结构化转换层决定了房子住得舒不舒服。
2. Lovart 简介
Lovart 是一款定位为「AI 设计智能体(Design Agent)」的产品,由 Resonate International INC 开发。其核心能力是将用户的自然语言需求,自动转化为专业级的设计产出(图像、视频、3D 等)。
- 官网 :www.lovart.ai
- 定位:全球首个 AI 设计智能体
- Slogan:「让设计更加智能,让交付更加高效」
3. 产品架构分析
Lovart 的产品架构可以分为三层:
scss
┌─────────────────────────────────────────────────────────────┐
│ 用户交互层 (UI) │
│ 自然语言输入 → 实时画布渲染 → 可视化编辑 │
├─────────────────────────────────────────────────────────────┤
│ 结构化转换层 (灵魂) │
│ AI 输出解析 | 图层分离 | 布局推断 | 语义理解 │
├─────────────────────────────────────────────────────────────┤
│ AI 模型聚合层 (水电煤) │
│ Sora2 | Veo3.1 | Midjourney | Kling | Hailuo | Seedream │
├─────────────────────────────────────────────────────────────┤
│ 矢量渲染引擎层 (底座) │
│ 矢量渲染 | 图层管理 | 实时预览 | 导出交付 │
└─────────────────────────────────────────────────────────────┘
关键洞察
Lovart 并没有自研大部分 AI 生成模型------它聚合了市面上几乎所有顶级的图像/视频生成模型(Sora、Veo、Midjourney、Kling、Hailuo 等),通过统一的 API 调用提供给用户。
这意味着:AI 生成能力是「可购买」的标准化服务,不是 Lovart 的护城河。
4. 壁垒一:矢量渲染引擎(底座)
没有渲染引擎,一切都是空中楼阁。
4.1 为什么是「底座」?
| 挑战 | 说明 |
|---|---|
| 工程复杂度 | 专业级设计软件需要处理矢量路径、布局约束、图层混合、渐变/阴影等,工程量巨大 |
| 性能要求 | 实时预览需要 60fps 流畅渲染,对 WebGL/WebGPU 有极高要求 |
| 交互体验 | 拖拽、缩放、对齐等交互需要毫秒级响应,前端优化深度决定用户体验 |
| 格式兼容 | 需要支持与 Figma、Sketch、Adobe 等工具的格式互通 |
| 长期积累 | 这类技术无法靠资金快速堆积,需要团队长期沉淀 |
4.2 可替代性分析
| 环节 | 技术实现 | 可替代性 |
|---|---|---|
| AI 生成 | 调用第三方 API(Sora、Midjourney 等) | 极高,任何人都可以接入 |
| 自然语言理解 | LLM(GPT 等) | 极高,标准化 API |
| 实时画布渲染 | 自研前端矢量引擎 | 极低,需要大量工程投入 |
| 图层编辑系统 | 自研图层管理 | 极低,专业级设计软件门槛 |
| 设计元素组合 | 布局/对齐/变换系统 | 极低,Figma 级的工程复杂度 |
5. 壁垒二:结构化转换层(灵魂)
渲染引擎决定「能不能做」,结构化转换决定「好不好用」。
5.1 核心问题:AI 输出 ≠ 可编辑设计稿
很多人假设 AI 生成的内容可以直接进入引擎编辑,但实际上:
| AI 输出 | 渲染引擎需要 |
|---|---|
| 位图(Pixels) | 结构化矢量路径 |
| 杂乱的 SVG | 清晰的图层树 |
| 无语义的像素块 | 带命名的组件/约束 |
5.2 真正的技术深水区
不仅仅是「渲染」,而是「如何将 AI 的混沌输出瞬间转化为有序的图层结构」:
css
AI 生成结果 → [结构化转换层] → 可编辑的设计稿
↑
这里才是灵魂
核心能力包括:
- 自动矢量化:位图 → 可编辑矢量路径
- 自动图层分离:混沌像素 → 语义化图层树
- 自动建立约束:静态布局 → AutoLayout 响应式结构
- 自动命名/分组:无序元素 → 符合设计规范的组件
这才是让设计师觉得「好用」的关键 ------用户不是想要一张图,而是想要一个可以继续编辑的设计稿。
6. 为什么 AI 模型不是壁垒?
- 模型同质化:Sora、Veo、Midjourney 等模型的 API 对所有人开放,成本差异仅在于规模效应。
- 模型迭代快:今天的最强模型,3 个月后可能被新模型超越。押注单一模型是高风险策略。
- 用户无感知:用户不关心后端用的是 Sora 还是 Veo,只关心最终产出的质量和可用性。
Lovart 的聪明之处在于:做模型的「聚合者」而非「自研者」,将精力聚焦在用户真正能感知到的前端体验上。
7. 商业模式验证
Lovart 的订阅定价印证了上述分析:
| 套餐 | 月费 | 核心卖点 |
|---|---|---|
| Starter | $16/月 | 2000 积分,2 并发 |
| Basic | $27/月 | 3500 积分,4 并发 |
| Pro | $45/月 | 11000 积分,8 并发 |
| Ultimate | $99/月 | 27000 积分,10 并发 |
注意 :Lovart 的积分是用来消耗 AI 模型调用的(即可变成本),而订阅费用的核心是为了支撑其前端产品体验的持续迭代。
8. 对 FigDev 的启示
8.1 我们的优势
FigDev 的技术路线与「底座 + 灵魂」的成功逻辑高度契合:
| 壁垒类型 | FigDev 的对应能力 |
|---|---|
| 矢量渲染引擎(底座) | WebGPU 自研矢量渲染引擎 |
| 实时画布渲染 | flare/ecs + ECS 架构 |
| 图层编辑系统 | Figma 视图层实现 |
| 设计元素组合 | AutoLayout (yoga-layout) |
| 结构化转换层(灵魂) | dataTransformation 模块 |
| Figma JSON → ECS 节点 | 已实现 |
| 矢量路径解析 | svgPathParser |
| 自动布局约束 | AutoLayoutSys |
8.2 战略建议
| 优先级 | 策略 | 说明 |
|---|---|---|
| ⭐⭐⭐ | 深耕渲染引擎 | 60fps、复杂路径、渐变填充等「难啃的骨头」才是真正的壁垒 |
| ⭐⭐⭐ | 扩展转换层 | 将 dataTransformation 能力扩展到「AI 输出 → 结构化设计稿」场景 |
| ⭐⭐ | 自研专用小模型 | 训练「最懂设计编辑」的专用模型(见下文) |
| ⭐ | 聚合 AI 模型 | 不做大模型军备竞赛,直接聚合 Sora、Midjourney 等 |
8.3 差异化定位
Lovart:AI 生成 → 静态内容(2D/3D/视频)
FigDev:AI 生成 → 静态或带交互的内容(2D/3D/视频/网页)
9. AI 小模型策略:建立独特壁垒
虽然不做大模型军备竞赛,但自研专用小模型是必要的。
9.1 为什么需要小模型?
结构化转换层的「灵魂」能力,需要 AI 来增强:
| 小模型类型 | 核心作用 |
|---|---|
| 结构化识别模型 | 将 AI 生成的位图/SVG 转化为语义化图层结构 |
| 布局推断模型 | 自动识别元素关系,建立 AutoLayout 约束 |
| 设计修正模型 | 根据设计规范自动优化间距、对齐、配色 |
9.2 数据飞轮:用户行为反哺模型
核心洞察:用户在编辑器中的每一次修改,都是最高质量的标注数据。
markdown
AI 生成 → 用户在编辑器中修改 → 修改记录作为训练数据 → 反哺小模型 → AI 生成更准确
↑ ↓
└──────────────────────────────────────────────────────┘
| 用户行为 | 数据价值 |
|---|---|
| 调整图层层级 | 训练「图层分离模型」 |
| 修改布局约束 | 训练「布局推断模型」 |
| 重命名组件 | 训练「语义理解模型」 |
| 修正颜色/间距 | 训练「设计修正模型」 |
10. 总结
核心框架
| 层级 | 定位 | 战略优先级 |
|---|---|---|
| 矢量渲染引擎 | 底座 --- 决定「能不能做」 | ⭐⭐⭐ |
| 结构化转换层 | 灵魂 --- 决定「好不好用」 | ⭐⭐⭐ |
| AI 小模型 | 增强 --- 形成独特壁垒 | ⭐⭐ |
| AI 大模型 | 水电煤 --- 聚合即可 | ⭐ |
一句话总结
渲染是底座,转换是灵魂。 FigDev 的核心竞争力不在于生成了什么,而在于如何承接、编辑、组织和交付这些生成的内容。
更多精彩内容可关注 风起的博客 ,微信公众号:听风说图