引言
在数字化信息飞速流转的今天,图文转化需求日益增多。无论是处理工作中的资料,还是整理生活中的图片内容,将图片转化为 PDF 文档并进行进一步操作都十分常见。最近,我在 Coze 平台上精心设计了一个智能体,它能像一位专业的图文转化大师一样,高效处理图片内容,满足一系列相关需求。接下来,我就详细给大家讲讲这个智能体的打造过程和它的神奇功能。
智能体人设与回复逻辑
这里就是一段简单的prompt设定。

证明一下:
这是我新设定的野人人设和回复逻辑:

然后我直接将这个左边的文案发送给豆包,再进行对话,可以看到,效果是一样的,所以 coze 复杂的地方在于中间的技能部分,prompt 在和豆包天天玩角色扮演的经验下已经轻车熟路了(扮演什么就别问,大人的事情)。

ps: prompt 设定也很重要,当你接入插件太多,有相似的,但是这个大模型会挑方便的,有些可能用牛刀砍小鸡了,浪费性能,还可能出现"加钱居士"。
技能大揭秘
图片文本提取
当用户传入一张图片的 URL 时,这个智能体就会立刻启动 "图片转文字" 技能(通过 image2text 来实现)。插入下面的 OCR 插件实现,这个插件只能提取文字,我们肯定要加入新的插件,那我们怎么实现互动呢?

文本打印成 PDF
其实看 prompt 就知道了,让它们两个插件交互只要让大模型知道我们接下来要干嘛要使用哪个插件就行(0代码依旧带派啊)。要是用户表示想要打印文本,智能体的另一个技能 "生成 PDF"(借助 create_document 实现)就派上用场了。
从下面图片可以看到还可以生成 docx、html、markdown 等多种格式的文档,大家可以根据自己喜欢的设计,因为本质是一样的,只要修改一点 prompt 即可。

发送 PDF 到邮箱
第三个功能由第三个插件实现,方法和上面类似。当用户要求把文档发送到邮箱时,智能体就会调用 "创建邮件服务"(create_email),把 PDF 文档打包,然后发送到用户指定的邮箱里。要是用户一开始忘记输入邮箱了,它会提醒用户输入邮箱,等用户发送完邮箱信息后,再把邮件发出去。

好了,到了这里功能就全部完成了,零代码还是爽的!每次探索 coze 都会让我发现很多新奇的小玩意,还有很多好玩的插件------飞机行程的、天气的、计算的、读取网页和文档的、生成图片的,甚至有算卦、做菜谱的等等,相信要不了多久它能涵盖各行各业。
设定的限制条件
为了让智能体的服务更加规范和贴心,我还给它设定了一些限制条件。每次读取完图片信息后,它都得问问用户是不是要打印,这是为了确保用户能得到自己想要的服务,不会错过任何一个步骤。而在打印完成之后呢,它也得再问问用户要不要发送到邮箱,这样就不会出现用户想分享文档却没机会的情况啦。这些小小的限制条件,就像是给智能体戴上了一副精准的眼镜,让它能更好地看清用户的需求,提供更周到的服务。
总结
通过在 Coze 平台上的这次设计,我成功打造出了一个功能强大又贴心的图文转化智能体。它不仅能准确地提取图片文本、生成 PDF 文档,还能按照用户的要求发送到邮箱,每一个步骤都环环相扣,高效又便捷。这个过程让我深刻体会到了智能体设计的魅力和实用性。期待大家能在 Coze 平台上创造出更多有趣又实用的智能体!