AI 文字信息图表的技术选型

文字信息是最朴素的信息载体,即使是 AI 时代,大模型的输出都是文字信息居多。

文本信息图

我们大量的产品,其实都是在做文字信息的整合和可视化,比如:PPT、流程图、思维导图、信息海报等软件,包括一些博客的图文混排模式,其实都是在对文字信息进行归纳和可视化,这部分我们都可以称之为文本信息的可视化,或者信息图可视化。

AI 时代下,文本大模型对于文本信息理解和处理能力大大加强,大模型能很清楚的理解文字的结构信息,表达的核心观点,以及从非结构信息中抽取和推理有用的、结构化信息。

所以在 AI 来临之后,有大量的 AI Agent 应用都是关注在文字的处理和呈现上的,比如 AI PPT、AI 流程图、AI 图表、以及各类的 DeepResearch 应用。

最近蚂蚁集团发布的很火的灵光,抢眼的表现,原因之一就是灵光可以让模型输出更多形态的内容,包括图片、视频、3D、交互图表,信息图等。

技术实现和选型

业界上,实现文本信息可视化的,有一些形态,但是大部分,都是信息图的制作平台。如果大家做过调研,大概就知道如下的产品。

核心功能基本都是一致的:

  • AI 能力层:选择合适的模版,从用户文本抽取数据。
  • 输出信息图:支持导出 PNG/SVG 等多种媒介格式。
  • 信息图编辑:提供在线 Web 可视化界面交互配置。
  • 数据存储:设计DSL Schema / 画布状态保存数据。
  • 信息图渲染:基于浏览器 Canvas/SVG 封装渲染引擎。

但是问题也很明显:付费使用、模板灵活性低、闭源的生态、集成到应用基本不可能。

所以我们在想,如果我们的业务系统需要实现类似的文本信息图可视化该怎么做,有几种方案:

Mermaid

是一个基于 JavaScript 的绘图和图表工具,呈现受 Markdown 启发的文本定义,以动态创建和修改图表。常用于创建:时序图、流程图、类图、时间轴,等 ~20 中图表。

是社区广泛采用的一种方案,当然,问题就是图形一般偏技术的同学看的,对于普通的文字内容和结构呈现,并不适合。

使用 AI 直出 HTML + SVG

使用 AI 大模型 + 提示词,生成最终的 HTML 或者 SVG,然后最终生成对应的 HTML 或者 SVG 渲染,这个可能是未来长期的方向。

不过就目前的效果来看,HTML 效果比 SVG 要稍微好一点,SVG 生成依然会遇到各种布局点的位置,特别像文字碰撞基本无法处理;HTML 上就是风格上会比较单一一些,颜色和 border 上,有很强的 AI 味道。

使用多模态大模型生成信息图图片

gemini 3 发布,加上 banana pro 的发布,让多模态模型直接输出信息图,基本变成了现实,效果很好,而且在大部分多模态遇到的中文问题,也能很好的解决。

当然,也会有一些小问题,这些问题更多是图片这个存储格式带来的:

  1. 无法二次编辑,或者很好做到很好的二次编辑
  2. 无法实现动画效果
  3. 无法交互

AntV Infographic

Infographic 是 AntV 在 2025 年 11 月 22 日开源出来的一个信息图可视化框架,主要关注在渲染部分,提供了 100+ 的优质信息图模版,除此之外,也增加了自定义的开发能力,让模版数量能倍数增长;图的设计风格比较适用于 PPT 和写文章配图的那种场景。

也有提供各种风格,内置深色模式、手绘、纹理视觉风格,手绘风格这个很酷。另外,为了在 AI 上更好的使用,也做了 AI 友好的配置和描述,并在官网提供了 AI Agent 来使用,以及用于二次编辑的编辑器组件。

所以相关文本信息图可视化的业务,接入的时候,只需要参考响应的提示词,生成 Infographic 的配置,然后使用 Infographic 渲染即可。

技术选型总结

最后总结一下,AI 产品在处理文本信息图可视化的方案对比,仅供参考。

方案 优势 劣势
Mermaid + 社区影响力大 + 能力丰富,强大 + 模型输出准确 - 技术类型的信息图 - 不适用于普通文本信息可视化 - 包比较大 2.7 Mb
AI 出 HTML / SVG + 接入简单容易 - 准确度、风格不可控 - 模版样式比较单一 - 会容易出现一些体验问题
多模态出图片 + 新的 banana pro 效果不错 - 无法编辑、无动画和交互 - 闭源模型,调用贵
AntV Infographic + 开源、免费 + 模版丰富,目前内置 100+,可开发扩展,支持不同风格 + 支持编辑,以及提供编辑器 + 接入过程完全可控 + 包轻量,410 Kb - 集成有 Agent 研发工作量(开发和测评)

综上,个人建议,如果在做 AI 文字配图,信息图之类的需求,可以考虑使用 AntV Infographic + Mermaid 相结合的方式,技术图表使用 Mermaid,常见的 PPT、文字结构配图,使用 AntV Infographic。

最后

信息图的生成,未来大模型一定会支持直出代码,但是当前来看,这个时间可能依然还是 2-3 年后,个人感觉这丝毫不影响信息图渲染技术的持续迭代。

因为 AI 不会减少需求,反而会扩大用户量,提升需求和用户量,而信息图渲染技术 Infographic 会因为这个需求的增长,具有更多的用户量。

AI 直接出码是趋势,但是不代表基础技术库消亡,而是作为出码的依赖存在。

相关推荐
胡楚昊1 小时前
Polar WEB(21-
前端
BD_Marathon1 小时前
【JavaWeb】HTML专业词汇
前端
lichong9511 小时前
鸿蒙系统 4.1.0 兼容 Android apk 如何检测兼容的 Android 系统版本是多少
前端·javascript
colorFocus1 小时前
Vue之如何获取自定义事件返回值
前端·vue.js
草帽lufei1 小时前
业务代码迭代重构利器:SOLO中国版保障项目需求
前端·ai编程·trae
好_快1 小时前
Arco Design Layout 中使用 ResizeBox 实现可拖拽侧边栏
前端·vue.js·arco design
国服第二切图仔1 小时前
Electron for 鸿蒙PC项目实战—折线图组件
javascript·electron·鸿蒙pc
重铸码农荣光1 小时前
JavaScript 面向对象编程:从字面量到原型继承的深度探索
前端·javascript·设计模式
打工仔张某1 小时前
Node-Req-Cache
javascript