一键生成PPT!让AI成为您的最佳帮手!

导读:本期文心开发者说邀请到Digilifeform创始人张永城老师和少年开发者张熠墨老师,分享使用文心大模型制作AI PPT应用的全流程,以及该应用的定位和用途。

一、如何打造一键生成PPT

AI PPT是一键全自动生成图文信息并保存为PPT格式下载的线上工具,用户只需要简洁清晰的描述需求,即可在2分钟内转化为高质量的PPT,包括标题、文字结构等。该工具可以针对PPT每页的标题,智能理解标题语义并匹配对应的配图,最终生成图文并茂的PPT,并且支持一键免费下载。对于用户而言,这是一个真正免费且免注册登录的AI PPT生成工具。

该工具生成的ppt最后一页带有广告,用户可以随时删除。广告是通过AI算法,且基于用户输入的提示词实现智能匹配,比如用户输入策划一场车展,智能匹配的广告会和车、展会、策划相关,做到精准广告匹配。

二、大模型应用的整体业务流程框架

首先用户提交PPT制作需求,在这个过程中会输出markdown结构的页面内容,主要是封面、页面标题和列表内容。接着我们调用百度的AI能力,智能理解标题转化成关键词,接着调用开源图库生成关键词对应的图片。服务端将markdown格式的内容解析为PPT需要的格式,开始匹配用户选择的模板样式,并结合AI PPT自研广告精准匹配算法,在最后一页生成广告图,用户可以直接下载最终的PPT,在本地进行编辑修改。

三、技术难点与门槛

在AI PPT应用的开发过程当中,存在着三点技术难点与门槛。

第一点是内容稳定性,最初在大模型中返回的markdown,在过程中缺少SFT对产品的训练。因此我们通过AI输出全行业内使用频率高的PPT,例如输出1万个PPT构成数据基础,基于PPT的结构以及内容,我们通过AI选出了接近100个优质PPT,这一百个标签是判断PPT是否优质的标准。完成上述流程后,我们让AI标注这一万个PPT,分析哪些PPT可以满足优质标准的,最终把这一批优质的PPT输入模型做训练。

第二点是场景包容性,包容性是指用户使用许多不同场景的prompt去生成PPT时,有时结果差异较大。比如它使用比较简洁的内容时,现在的模型是挺优质的,但是如果使用的是较为复杂的内容,现在的模型输出的内容主要是在原内容基础上进行加工,并没有专门进行结构梳理。

第三点是简与强的矛盾。目前市面上很多生成PPT的产品,可以提供给用户深度的过程参与。我们的产品定义是简,在强大功能跟极简之间寻找平衡。用户生成PPT可能只需要两分钟或三分钟,输出后根据自己的要求修改,这是产品的一个定位。

Digilifeform创始人张永城和少年开发者张熠墨为大家带来AI PPT应用的开发全流程,讨论了项目在技术和产品上遇到的一些技术难点,帮助大家更好理解大模型应用开发的相关知识。想要了解技术详情可加入文心开发者说课程观看回放。希望大家在飞桨星河社区里面去学习更多大模型的知识,制作更多基于大模型的原生应用。

相关推荐
音视频牛哥1 小时前
打通视频到AI的第一公里:轻量RTSP服务如何重塑边缘感知入口?
人工智能·计算机视觉·音视频·大牛直播sdk·机器视觉·轻量级rtsp服务·ai人工智能
Wendy14412 小时前
【灰度实验】——图像预处理(OpenCV)
人工智能·opencv·计算机视觉
中杯可乐多加冰2 小时前
五大低代码平台横向深度测评:smardaten 2.0领衔AI原型设计
人工智能
无线图像传输研究探索2 小时前
单兵图传终端:移动场景中的 “实时感知神经”
网络·人工智能·5g·无线图传·5g单兵图传
zzywxc7873 小时前
AI在编程、测试、数据分析等领域的前沿应用(技术报告)
人工智能·深度学习·机器学习·数据挖掘·数据分析·自动化·ai编程
铭keny4 小时前
YOLOv8 基于RTSP流目标检测
人工智能·yolo·目标检测
墨尘游子4 小时前
11-大语言模型—Transformer 盖楼,BERT 装修,RoBERTa 直接 “拎包入住”|预训练白话指南
人工智能·语言模型·自然语言处理
金井PRATHAMA4 小时前
主要分布于内侧内嗅皮层的层Ⅲ的网格-速度联合细胞(Grid × Speed Conjunctive Cells)对NLP中的深层语义分析的积极影响和启示
人工智能·深度学习·神经网络·机器学习·语言模型·自然语言处理·知识图谱
天道哥哥4 小时前
InsightFace(RetinaFace + ArcFace)人脸识别项目(预训练模型,鲁棒性很好)
人工智能·目标检测
幻风_huanfeng5 小时前
学习人工智能所需知识体系及路径详解
人工智能·学习