用扣子Coze搭一个听故事学英语智能体,用上Deepseek R1满血工具版

为什么重写扣子智能体教程

很多朋友大概听过扣子(Coze)这个产品,是字节出品的AI应用开发平台,不需要懂代码,普通人也能创建和发布自己的 AI 智能体。

国内版:www.coze.cn/ 国际版:www.coze.com/

去年底,受朋友邀请,回字节参加公益活动,给大学生讲如何用Coze搭建AI Agent。

PPT和文档地址: xiangyangqiaomu.feishu.cn/wiki/XWIkwi...

时隔几个月,Coze功能和界面发生了不少变化,最近还推出了满血版的Deepseek R1和V3,加上了Function calling工具调用功能。

值得重写个教程。

打算用一个具体案例,讲讲Coze搭建工作流,并用上满血Deepseek R1工具版。

案例:听英语故事学英语智能体

学英语最有效的办法:多听多跟读,把一篇文章或故事读透。

基于这个想法,设计一个智能体实现:

AI自动抓英文短篇故事,合成英文MP3文件,提取文章中CET4以上的词汇,总结一句话剧情,辅助理解和学习。

效果如下:

访问地址: www.coze.cn/store/agent...

或长按或扫描二维码体验

创建智能体

  1. 选创建智能体
  2. 填写基本资料

名称,简单介绍,点击自动生成图标,创建即可。

智能体组成

Prompt: 描述智能体功能,定义什么时候调用工作流。

模型: 这个智能体用什么模型(选的是Deepseek V3 工具调用)

工作流: 如何响应处理用户的请求

数据库: 存储一些重要数据,这里是存英文故事URL(选用)

最复杂和关键部分是 工作流,安排AI 如何从一个URL地址开始,怎么加工处理各种数据,最终输出什么内容。

工作流搭建

首页 -> 工作空间 -> 资源库 -> 创建工作流

填写工作流名称(英文)和描述(方便AI理解调用,简单清楚)

最终完成版

重点有四步:URL抓取、语音合成、图片生成、LLM加工

URL抓取

点"添加节点"->"插件",添加一个链接读取插件 把第一步连到这个插件,点开配置,URL选第一步的input

语音合成

点"添加节点"->"插件",添加一个语音合成插件,推荐搜索"英语文本转语音",质量高,配置简单。

选个喜欢的声音添加进去。

点开配置,把上一步插件的content作为text输入。

LLM加工

因为我们不仅仅只想要一个音频。

还想让AI输出故事原文,提取重点单词,一句话总结等。

点"添加节点" ->"大模型",然后点开配置:

注意: 模型选的豆包1.5 pro 256k,感觉上下文空间大些,避免碰到太长的文章。

  1. input选抓取页面插件的"content"字段,也就是抓到文本内容。
  2. 重点:用户提示词,一定要记得引用变量,就是{{input}},这是让LLM处理的内容。Prompt可以很简单,说明提取什么,设为什么变量。
  3. 输出部分,对应上你设定的变量。

敲黑板:这部分最重要,以后搭建任何工作流,都可能用到这个方法。

图片生成(可选)

全是文本,看起来不生动,而且视觉输入也对加深记忆有好处。

点"添加节点" ->"图像生成",连接大模型模块,input选大模型对应的一句话故事总结,提示词用{{input}} 变量。

相当于把故事梗概发给图片生成模型,得到一张故事图片。

调用工作流

把做好的工作流发布后,智能体就可以调用了。

回到智能体编排界面:

  1. 添加一个工作流,选择刚创建好的。
  2. 写Prompt,告诉智能体什么时候调用工作流。

故事 URL 数据库

工作流有了,调用也有了,故事URL从哪里找呢?

其实,有很多英文短篇故事网,比如 www.fridayflashfiction.com/100-word-st...

www.english-for-students.com/

虽然能让AI调用插件随时抓取,但感觉存数据库更稳定。

可以用Chrome插件如Link grabber采集。

chromewebstore.google.com/detail/link...

或者让AI编程写工具抓取,以后再单独讲。

创建一个数据库,添加一个URL字段,把采集网址按照xlsx模版,粘贴后上传,导入数据库。

锦上添花,给工作流绑定卡片

智能体已经能运行,但发现返回音频是一个URL,点击跳转到另一个页面播放。

体验不够好。

经研究发现,原来可以把工作流返回的数据,通过设计一个卡片界面输出。

卡片可以调用播放器组件,文本组件,像搭积木一样,做一个GUI的界面,而不再是纯文本回复。

"首页"-"工作空间"-"资源库"-"卡片"

搭建英语故事学习卡片,用上了播放组件,文本组件,图片组件。

卡片设计完,一定要设定变量。 有了变量,才能把工作流输出的数据,显示在卡片上。

以音频为例,创建一个"音频"变量,点击音频组件,找到音频变量绑定。

其他同理

卡片制作发布后,如何绑定智能体和工作流呢?

回到智能体编排界面,鼠标hover在工作流位置,会出现一排icon,点击绑定卡片数据

挨个点选绑定对应的变量:

快捷指令

现代人都很懒,能点选,绝不打字。

所以为了体验,可以给智能体加一些对话框上方的快捷操作按钮。

比如我创建一个"听故事"按钮。

指令内容很简单,为了模拟用户打字内容,调起工作流。

发布智能体

可以选很多发布渠道,比如豆包、飞书等等。

融入推理模型 Deepseek R1 工具版后,感觉对工具的调用变的更准确。

能看到AI推理过程,对写提示词和调试,也变的更轻松。

虽然仍存在一些小问题,但这个演化方向没毛病。

另外,最近一直在研究MCP协议,Raycast工作流。

AI工具的演化方向越来越清晰:

人类用自然语言跟AI对话,AI则用模型推理能力,调用各种外部工具、知识库解决用户问题。

扣子(Coze)添加 Deepseek R1满血版,而且刻意加了工具调用能力,也是往这个方向努力。

非常期待今年AI Agent的大爆发,这样人类就可以变的"更懒"一些

相关推荐
FogLetter24 分钟前
魔搭社区与LLM:开启AI魔法新时代的钥匙
python·aigc
程序边界25 分钟前
AIGC与影视制作:技术革命、产业重构与未来图景
重构·aigc
FogLetter41 分钟前
Node.js与OpenAI的完美融合:打造你的AI驱动型后端应用 🚀
后端·aigc
iThinkAi1 小时前
Coze(扣子)智能体工作流:1分钟生成10个,爆款唐朝“胖贵妃”对口型视频,无需剪辑
aigc
墨风如雪1 小时前
炸裂!DeepSeek 8B 量化版降临:告别显存焦虑,你的 3080 Ti 也能玩转顶级大模型了!
aigc
PPIO派欧云1 小时前
PPIO私有化部署模板上新!10分钟拥有专属最新DeepSeek模型
llm·aigc·api
leeguoo2 小时前
Misonote Markdown 2.0 - AI 原生文档系统革命性升级
aigc
小和尚同志12 小时前
4.9k star-开源版 DeepWiki
人工智能·aigc
wei_shuo14 小时前
【玩转腾讯混元大模型】腾讯混元大模型AIGC系列产品深度体验
aigc
cloud studio AI应用15 小时前
《基于AIGC的智能化多栈开发新模式》研究报告重磅发布! ——AI重塑软件工程,多栈开发引领未来
人工智能·aigc·软件工程