Dify工作流:爬虫文章到AI知识库

部署Dify

代码拉取

bash 复制代码
git clone https://github.com/langgenius/dify.git
cd dify/docker

启动容器

bash 复制代码
docker-compose up -d

启动成功

准备知识库

创建知识库

创建一个空的知识库


要先从网址中,找到这个知识库的id,记下后面需要用到。

新建API密钥

创建密钥,后面通过API将数据写入知识库用到

记下创建文档的API

后面通过这个API将数据写入知识库用到

安装工具

安装模型

打开插件,选择模型

安装模型

配置模型

这里使用通义千问,因为开通的180天内免费100万个token。没有API Key可以从左下角获取。

安装Firecrawl

Firecrawl是一个爬虫工具。

配置Firecrawl

获取Firecrawl的API Key

创建爬虫知识库

创建Chatflow

创建参数提取器

创建爬虫

要抓取的URL:填写上一步返回的website

结果的格式:markdown

仅抓取主要内容:选择true

请求头: {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/91.0.4472.124 Safari/537.36'}

创建模板转换

模板转换的作用是获取上一步的爬虫内容的text,给下一步用。

创建提取标题与正文

创建代码执行

过滤爬虫内容的特殊字符

javascript 复制代码
function main({arg1}) {
    return {
        content: arg1.replace(/\\/g, '\\\\').replace(/"/g, '\\"').replace(/\n/g, '\\n').replace(/\r/g, '\\r').replace(/\t/g, '\\t')
    }
}

创建HTTP 请求

将爬虫的数据通过知识库API保存到上面创建的知识库

将上面复制的接口粘贴到这里

bash 复制代码
curl --location --request POST 'http://192.168.51.101/v1/datasets/{dataset_id}/document/create-by-text' \
--header 'Authorization: Bearer {api_key}' \
--header 'Content-Type: application/json' \
--data-raw '{"name": "text","text": "text","indexing_technique": "high_quality","process_rule": {"mode": "automatic"}}'

将dataset_id替换成上面保存的知识库id

添加接口的鉴权

填写上面保存的API-Key

填写BODY

最后的回复

测试

测试成功

相关推荐
Angel3 天前
Dify系列课程 - 4.Dify实战(本地部署-源码下载与部署)
ai·dify·dify实战·dify实战指南·dify docker 部署·ai实战 应用
海市公约4 天前
从 CRUD 到 AI 工程:基于 FastAPI + Dify 的 AI 面试模拟系统实践
prompt·fastapi·项目实战·dify·ai工作流·后端架构
rundreamsFly5 天前
Dify 1.14.0 发布:从“单机玩具”到“工业级协作”的硬核进化
人工智能·dify
展示猪肝6 天前
Vue2 + FastAPI + Dify 实现 AI 医疗预检分诊助手:从问诊追问到医生审核闭环
人工智能·vue·fastapi·dify
辞忧九千七6 天前
前后端分离架构实战与项目落地:AI智能学习笔记管理系统
python·html·axios·css3·fastapi·dify
rising start6 天前
InsightEdu - 轻量智能学习平台
javascript·axios·css3·html5·fastapi·orm·dify
todoitbo6 天前
我把dify构建的CloudMart 知识库客服一键部署到了 EdgeOne Pages
人工智能·ai·智能客服·edgeone·dify
Lethehong6 天前
Dify + EdgeOne:AI应用从Demo到上线的最后一公里
服务器·网络·人工智能·edgeone·dify
我叫张小白。7 天前
劳动力招聘管理系统:全栈实战(Vue3+FastAPI+WebSocket+Dify)
websocket·vue·毕业设计·状态模式·fastapi·dify·智能体
LCG元9 天前
Dify 平台集成 Phoenix 实战:提升智能体全链路可观测性
dify