Dify 工作流分享-JinaSum

小伙伴们大家好,我是三金~

今天要分享的 JinaSum 其实在之前的文章《使用 dify-on-wechat 中的插件搭建私人助理》中已经有介绍过,不过它是以 dify-on-wechat 中插件的身份出现的,其主要作用就是捕获分享到微信聊天中的 url,然后爬取网页内容进行总结。

今天我们通过工作流的方式来实现一下。

打开 Dify 并新建一个空白工作流(起名就叫 JinaSum 好了),在这个工作流中我们需要四个节点:

  • 开始节点:接收一个网页链接;
  • HTTP 请求节点:这里可以通过之前我们部署的本地 firecrawl 服务来实现,也可以选择使用 jina 来实现,主要作用是爬取网页内容并将其转为 Markdown 格式;
  • LLM 节点:接收上一步传递过来的内容,并对其进行总结整理;
  • 结束节点:将总结的内容进行输出即可;

具体实现:

  • 在开始节点中,定义一个字段 url,这个字段主要用来接收用户想要进行总结的网页链接;
  • HTTP 请求,我们需要将网页链接地址发送给爬虫服务,让这个服务进行内容爬取并将其转换为 Markdown 格式,之后再将结果输出给下个节点。对于爬虫服务来说这里有两种选择:

一种是使用线上服务,推荐 jina AI:https://r.jina.ai/,我们只需要在这个链接后面拼接上开始节点输入的 url 链接即可。

另外一种是使用之前的文章中《本地部署 Firecrawl 爬虫让 AI 知识库更丰满》介绍的,使用 firecrawl 的服务:

相较之下 jina 会更简洁方便一点,但 firecrawl 的话可以根据自己的需求进行一些参数配置,定制化强一点。

比如可以通过设置 onlyMainContent 参数来限制返回的内容是否为主要内容,设置该参数为 true,则仅返回页面的主要内容,不包括页眉、导航、页脚等。

  • 将爬取到的网页内容输出到 LLM 中,在 LLM 中预设好提示词即可:

提示词:

我需要对下面的文本进行总结,总结输出包括以下三个部分:

📖 一句话总结

🔑 关键要点,用数字序号列出3-5个文章的核心内容

🏷 标签: #xx #xx

请使用emoji让你的表达更生动。

```markdown

<这里记得接收上个节点输出的数据>

```

  • 最后通过结束节点输出总结好的内容

我们来测试一下:

使用 Jina (图一)和 firecrawl (图二)都是可行的。

在完成该工作流之后,我们还可以通过右上角的发布按钮,将其发布为工具,这样的话既可以在 Agent 中使用,也可以将该工具再集成到别的工作流中循环利用。

觉得有用的大佬,轻抬小手 点赞收藏关注

相关推荐
fanstuck24 分钟前
Prompt提示工程上手指南(六):AI避免“幻觉”(Hallucination)策略下的Prompt
人工智能·语言模型·自然语言处理·nlp·prompt
zhangfeng11331 小时前
win7 R 4.4.0和RStudio1.25的版本兼容性以及系统区域设置有关 导致Plots绘图面板被禁用,但是单独页面显示
开发语言·人工智能·r语言·生物信息
DogDaoDao1 小时前
神经网络稀疏化设计构架方法和原理深度解析
人工智能·pytorch·深度学习·神经网络·大模型·剪枝·网络稀疏
西猫雷婶2 小时前
pytorch基本运算-Python控制流梯度运算
人工智能·pytorch·python·深度学习·神经网络·机器学习
说私域2 小时前
新零售第一阶段传统零售商的困境突破与二次增长路径:基于定制开发开源AI智能名片S2B2C商城小程序的实践探索
人工智能·开源·零售
寒月霜华3 小时前
机器学习-模型验证
人工智能·深度学习·机器学习
救救孩子把4 小时前
3-机器学习与大模型开发数学教程-第0章 预备知识-0-3 函数初步(多项式、指数、对数、三角函数、反函数)
人工智能·数学·机器学习
CareyWYR4 小时前
每周AI论文速递(250908-250912)
人工智能
张晓~183399481214 小时前
短视频矩阵源码-视频剪辑+AI智能体开发接入技术分享
c语言·c++·人工智能·矩阵·c#·php·音视频
deephub4 小时前
量子机器学习入门:三种数据编码方法对比与应用
人工智能·机器学习·量子计算·数据编码·量子机器学习