下班后回到家,用谷歌NotebookLM 生成了以下的一个PPT,我本次源素材,提供了一个本地的markdown文件,是我以前公众号发表的TapNow对接Nano Banana ,生成的过程比较慢,大概3-5分钟完成(也和内容篇幅长短正相关)。 办公效率显著提升啊,我就只是上传了一个md,上传点击生成演示文稿即可躺下喝杯猫屎咖啡了。 随着大模型对各行各业的赋能,AI办公行业如火如荼,AI生成ppt、AI辅助写作等应用层出不穷,Nano Banana Pro也能生成PPT了。

相对于AI辅助写作,基于AI的ppt生成难度较大,由于ppt内的元素较多、形态多样,叠加动画、切换等效果,造成ppt的程序化处理困难,增加了ppt生成的难度。
我去扒了下,AI ppt的生成原理。涉及人工智能技术领域,具体地说是一种适用于基于AI的PPT生成程序化处理方法。
大致是将PPT内的元素以及各种效果全部编译成Json文件,通过对Json文件的操作实现对ppt的修改,最后经过反向渲染,生成最终的PPT。
NotebookLM 的源素材也支持文档、音频、图片、纯文字等素材(word、txt、markdown、pdf格式的文件),那么AI首先对用户上传文档、音频、图片、纯文字或在线选择的ppt模板进行解析,并对上传的文件进行解析抽取有效信息,生成ppt的内容素材。将ppt模板数据整理成Json文件,源素材数据包括文字、字体、配色、形状、位置、动画、图片数据,并将其编译到Json文件中。
根据用户上传的内容文件或者大模型生成的ppt文本内容,生成ppt初始文件的内容素材。
再根据获取到的ppt内容素材,生成ppt目录、内容、标题、章节页面,将ppt内容素材修改生成的Json文件。用户在初始文件的基础上进行ppt在线编辑(比如WPS AI, 可支持缩短篇幅、文案重写、续写)操作。根据用户在线编辑的各项操作(包括添加或修改文本、动画、图片后完成PPT的制作),修改Json文件。修改后的Json文件进行反向渲染,生成最终的ppt文件。

在这一方案中,首先将已有的 PPT 模板和具体内容统一转换为 Json 文件,把模板中原有的参数配置、样式调整等功能性信息全部编译进 Json 结构中。随后,对用户在 PPT 中可编辑、可上传的各类文件内容,以及由大模型生成的文本和素材进行解析,生成一份 PPT 的初始 Json 文件。在此基础上,一方面对模板 Json 进行相应修改,另一方面允许用户在前端对该初始文件进行在线编辑和完善。最终,根据用户在线编辑所产生的 Json 变更进行反向渲染,自动生成符合需求的 PPT 文件。
如果本文能给你提供启发和帮助,还请留下你的一健三连(点赞、转发、评论),给我一些鼓励,谢谢。
最近的小开发 wubai-cq.github.io/easycutpro/
(推荐使用电脑chrome浏览器打开体验最佳,软件可下载) 非常适合在职场中需要频繁切换内、外网的朋友使用