AI 文字信息图表的技术选型

文字信息是最朴素的信息载体,即使是 AI 时代,大模型的输出都是文字信息居多。

文本信息图

我们大量的产品,其实都是在做文字信息的整合和可视化,比如:PPT、流程图、思维导图、信息海报等软件,包括一些博客的图文混排模式,其实都是在对文字信息进行归纳和可视化,这部分我们都可以称之为文本信息的可视化,或者信息图可视化。

AI 时代下,文本大模型对于文本信息理解和处理能力大大加强,大模型能很清楚的理解文字的结构信息,表达的核心观点,以及从非结构信息中抽取和推理有用的、结构化信息。

所以在 AI 来临之后,有大量的 AI Agent 应用都是关注在文字的处理和呈现上的,比如 AI PPT、AI 流程图、AI 图表、以及各类的 DeepResearch 应用。

最近蚂蚁集团发布的很火的灵光,抢眼的表现,原因之一就是灵光可以让模型输出更多形态的内容,包括图片、视频、3D、交互图表,信息图等。

技术实现和选型

业界上,实现文本信息可视化的,有一些形态,但是大部分,都是信息图的制作平台。如果大家做过调研,大概就知道如下的产品。

核心功能基本都是一致的:

  • AI 能力层:选择合适的模版,从用户文本抽取数据。
  • 输出信息图:支持导出 PNG/SVG 等多种媒介格式。
  • 信息图编辑:提供在线 Web 可视化界面交互配置。
  • 数据存储:设计DSL Schema / 画布状态保存数据。
  • 信息图渲染:基于浏览器 Canvas/SVG 封装渲染引擎。

但是问题也很明显:付费使用、模板灵活性低、闭源的生态、集成到应用基本不可能。

所以我们在想,如果我们的业务系统需要实现类似的文本信息图可视化该怎么做,有几种方案:

Mermaid

是一个基于 JavaScript 的绘图和图表工具,呈现受 Markdown 启发的文本定义,以动态创建和修改图表。常用于创建:时序图、流程图、类图、时间轴,等 ~20 中图表。

是社区广泛采用的一种方案,当然,问题就是图形一般偏技术的同学看的,对于普通的文字内容和结构呈现,并不适合。

使用 AI 直出 HTML + SVG

使用 AI 大模型 + 提示词,生成最终的 HTML 或者 SVG,然后最终生成对应的 HTML 或者 SVG 渲染,这个可能是未来长期的方向。

不过就目前的效果来看,HTML 效果比 SVG 要稍微好一点,SVG 生成依然会遇到各种布局点的位置,特别像文字碰撞基本无法处理;HTML 上就是风格上会比较单一一些,颜色和 border 上,有很强的 AI 味道。

使用多模态大模型生成信息图图片

gemini 3 发布,加上 banana pro 的发布,让多模态模型直接输出信息图,基本变成了现实,效果很好,而且在大部分多模态遇到的中文问题,也能很好的解决。

当然,也会有一些小问题,这些问题更多是图片这个存储格式带来的:

  1. 无法二次编辑,或者很好做到很好的二次编辑
  2. 无法实现动画效果
  3. 无法交互

AntV Infographic

Infographic 是 AntV 在 2025 年 11 月 22 日开源出来的一个信息图可视化框架,主要关注在渲染部分,提供了 100+ 的优质信息图模版,除此之外,也增加了自定义的开发能力,让模版数量能倍数增长;图的设计风格比较适用于 PPT 和写文章配图的那种场景。

也有提供各种风格,内置深色模式、手绘、纹理视觉风格,手绘风格这个很酷。另外,为了在 AI 上更好的使用,也做了 AI 友好的配置和描述,并在官网提供了 AI Agent 来使用,以及用于二次编辑的编辑器组件。

所以相关文本信息图可视化的业务,接入的时候,只需要参考响应的提示词,生成 Infographic 的配置,然后使用 Infographic 渲染即可。

技术选型总结

最后总结一下,AI 产品在处理文本信息图可视化的方案对比,仅供参考。

方案 优势 劣势
Mermaid + 社区影响力大 + 能力丰富,强大 + 模型输出准确 - 技术类型的信息图 - 不适用于普通文本信息可视化 - 包比较大 2.7 Mb
AI 出 HTML / SVG + 接入简单容易 - 准确度、风格不可控 - 模版样式比较单一 - 会容易出现一些体验问题
多模态出图片 + 新的 banana pro 效果不错 - 无法编辑、无动画和交互 - 闭源模型,调用贵
AntV Infographic + 开源、免费 + 模版丰富,目前内置 100+,可开发扩展,支持不同风格 + 支持编辑,以及提供编辑器 + 接入过程完全可控 + 包轻量,410 Kb - 集成有 Agent 研发工作量(开发和测评)

综上,个人建议,如果在做 AI 文字配图,信息图之类的需求,可以考虑使用 AntV Infographic + Mermaid 相结合的方式,技术图表使用 Mermaid,常见的 PPT、文字结构配图,使用 AntV Infographic。

最后

信息图的生成,未来大模型一定会支持直出代码,但是当前来看,这个时间可能依然还是 2-3 年后,个人感觉这丝毫不影响信息图渲染技术的持续迭代。

因为 AI 不会减少需求,反而会扩大用户量,提升需求和用户量,而信息图渲染技术 Infographic 会因为这个需求的增长,具有更多的用户量。

AI 直接出码是趋势,但是不代表基础技术库消亡,而是作为出码的依赖存在。

相关推荐
狗头大军之江苏分军8 分钟前
年底科技大考:2025 中国前端工程师的 AI 辅助工具实战盘点
java·前端·后端
编程修仙1 小时前
第三篇 Vue路由
前端·javascript·vue.js
比老马还六1 小时前
Bipes项目二次开发/硬件编程-设备连接(七)
前端·javascript
掘金一周1 小时前
前端一行代码生成数千页PDF,dompdf.js新增分页功能| 掘金一周 12.25
前端·javascript·后端
张就是我1065921 小时前
漏洞复现指南:利用 phpinfo() 绕过 HttpOnly Cookie 保护
前端
Kagol1 小时前
🎉TinyVue v3.27.0 正式发布:增加 Space 新组件,ColorPicker 组件支持线性渐变
前端·vue.js·typescript
潍坊老登1 小时前
大前端框架汇总/产品交互参考UE
前端
方安乐2 小时前
获取URL参数如何避免XSS攻击
前端·xss
十二AI编程2 小时前
MiniMax M2.1 实测,多语言编程能力表现出色!
前端