场景介绍
前一篇分享了如何用扣子插件和工作流来收集文章,今天,我给大家带来了升级版本,这次咱们给智能体加上个人偏好筛选、结果写入飞书多维表格,还可以支持多个链接地址。
任务目标:
实现文章收集智能体(升级版)。
任务要求:
-
加入个人偏好筛选,筛选出设定偏好的文章。
-
将收集的文章写入到飞书多维表格,方便后续查阅或者统计。
-
可同时收集多个链接地址。
分析问题
问题已经拆分好了,我们逐个进行分析:
-
加入个人偏好筛选,筛选出设定偏好的文章。
文字分析,"大模型"最擅长了,可以通过"工作流"中的"大模型"节点实现。
-
将收集的文章写入到飞书多维表格,方便后续查阅或者统计。
不用多说,直接使用"飞书多维表格"插件即可,比较重要的点是熟悉飞书插件参数。
-
可同时收集多个链接地址。
这是就要用到扣子工作流中的一个高级特性:批处理。
操作步骤
前置条件:注册并登录扣子平台。
建立智能体
可以参考上一篇文章重新建立一个智能体,也可以直接使用之前建立的智能体。
我这里新建智能体仅仅是为了方便与前一篇文章的智能体进行区分。
配置智能体
主要包括两点:
-
选择模式
依然选择"单Agent(工作流模式)"模式。
-
添加工作流
创建一个新的工作流"wenzhangshouji2"。
绘制工作流
先展示前一篇流程图作为参考。
下面我们将针对3个任务要求,逐一进行实现。
加入个人偏好筛选
该步骤最终流程图:
语料:
- 不推荐的文章链接:www.sohu.com/a/829158822...
- 推荐的文章链接:www.tongwuai.com/html/web/zh...
删除原有"写入Excel"节点
清理掉不必要的节点信息,减少干扰项及执行时间。
修改"大模型"节点
主要是修改提示词,以便实现按照我们的偏好筛选文章,提示词如下:
python
## 任务
帮我筛选给出的内容,如果不符合我的要求,给出是否推荐的明确意见。
筛选条件:
- 我比较喜欢科技相关内容
- 我不喜欢内容太长的文章,超过1000字为过长
## 要求
- 不要改变输入的文本内容。
## 步骤
1. 将{{input.title}}、{{input.content}}中所有的英文逗号替换为中文逗号,以免后续拼接歧义。
3. 返回```中的内容,
```{
"recommend": <文章是否推荐的意见>,
"reason": <文章是否推荐的原因>,
"content": {{input.title}},{{input.content}}
}```。
## 输出
参考案例如下:
文章符合要求则返回
{
"recommend": "推荐",
"reason": "科技元素较多",
"content": "标题,正文"
}
文章不符合要求则返回
{
"recommend": "不推荐",
"reason": "缺少科技元素",
"content": "标题,正文"
}
需要注意的是:
- 提示词中合适的设置格式(当前提示词使用的Markdown语法)、使用特殊字符(尖括号
<>
、引用符号```````````)可以更清晰的表达你的意图。 - 要求输出JSON格式字符串是为了方便后续大模型节点提取不同字段到飞书多维表格中。
这里穿插一点个人观点,大模型的能力是一样的,但是有些人使用起来事半功倍,有些人使用起来却事倍功半,我感觉很大程度都是提示词的差别。
提示词的能力提升,大家可以参考:
写入飞书多维表格
前置条件:
- 注册并登录飞书。
- "飞书"中新建多维表格"文章收集智能体"表格。
飞书文档很详细,大家可以直接按照官方文档操作即可。
官方文档:多维表格
该步骤最终流程图:
建立"文章收集智能体"表格。
表格如下:
四个字段:
- 标题:文章标题
- 正文:文章正文(由于飞书存储限制,正文过长可能存在不能存储的情况,大家实践过程请注意)
- 建议:推荐 or 不推荐
- 理由:大模型建议的理由
加入"飞书多维表格"插件,并配置参数。
加入插件问题不大,主要是配置参数。
其中重要的只有2个必填参数:
-
app_token:这个直接放上前面创建的多维表格的url即可。比如
https://ufls9c92x9.feishu.cn/base/NzMBbIhQOa84EhsDqSJcKFGxngb?table=tblVJCMQnu2d4wha&view=vewmDpPIl3
,插件会自动提取app_token使用,见下图1。 -
records:要插入表格的数据,该参数需要为
Array<Object>
,这个需要在该节点前一个节点设置输出参数格式
,见下图2。该参数我尝试过直接使用JSON字符串传递,没有成功,如果大家有什么其它可以传值的方法,可以评论告知,谢谢。
图1 图2
收集多个链接
该步骤最终流程图:
主要步骤:
插入文字处理节点
要求录入时,不同链接直接通过换行拆分,如下格式:
ruby
https://www.sohu.com/a/829158822_260616?scm=10001.691_14-200000.0.10006.&spm=smpc.channel_258.block3_undefined_Alu66w_1_fd.1.17322567372511PuvNP2_1090
https://www.tongwuai.com/html/web/zhishi/1859782826188099586.html
后续节点调整为批处理模式
获取链接内容节点、大模型节点、插入飞书节点调整为批处理模式,此处以"获取链接内容"节点为例。
节点顶部切换批处理后,对应的设置一般需要修改2个地方:
- 参数选择前一节点输出的数组,然后批处理会自动遍历这个数组,并将每次处理的变量命名为item1.
- 节点原本的输入,需要从原理的前一节点输出变量,改为当前节点每次处理使用的变量item1相关数据。
各节点截图:
- 获取链接内容节点
- 大模型节点
- 飞书多维表格节点
效果展示
智能体地址: 文章收集(升级版) - 扣子 AI 智能体
效果如下:
扩展
后续会在该智能体上持续升级:
- 数据来源多样化,除了链接,可以尝试支持各类文档,尤其是pdf。
- 业务领域细化,比如作为科研收集数据的助手,专注于从大片内容中提取目标数据。
大家如果有什么想法也可以评论交流哈~