大家在基于dify开发Workflow和Agent的过程中,都会用到知识库,dify提供了相应的功能实现知识库的管理,但有时候需要我们通过调用知识库的API服务接口,实现对知识库的管控,那么该如何实现呢?本文主要基于dify的API编写的演示示例,供大家参考。主要实现获取知识库,指定知识库文件的上传、知识库包含数据集的增删、分块内容的更新删除,标签更新删除等等。具体如下。
一、知识库文件上传
实现将指定文件上传到dify后端服务器中,为后续知识库中数据集构建做准备。如下图上方是请求部分,下方是返回结果,id是上传文件后的指定编号,后续在创建数据集时使用。

二、知识库的数据集操作
1.新增数据集
输入参数,详见下图。这里url里面的id是指定知识库id(相当于创建知识库后返回的知识库id),输入参数中的file_ids为上一步上传文件后分配的文件id,目的是将该文件作为数据集加载到指定知识库,并指定embedding模型、分块模式等参数,详见body里面指定的具体参数值。

输出结果,详见下图,这里的id是创建的数据集id。

2.删除数据集
将指定知识库下的数据集删除掉,这里url中的前一个id是知识库id,后一个id是数据集id(即:可以是上一步创建的数据集id)

三、知识库数据集的分块操作
1.增加更新分块
实现增加或更新单一分块,详见下图。
输入参数,这里url的第一个id是知识库id,第二个id是数据集id。body内容中指定了分块内容文本,主要关键词作为标签。

输出结果,这里的id是分块id,content是分块内容,keywords是关键词标签。

2.批量添加分块
在指定数据集下批量添加分块,详见下图。批量添加分块需要一个csv格式的固定模版,如下图,相当于按照给模版整理数据,并将该模版文件每一行分别添加到指定知识库的数据集中,并自动生成标签。这里url中的第一个id是知识库id,第二个id是数据集id。

3.删除分块
实现知识库数据集中指定分块的删除,这里url的第一个id是知识库id,第二个id是数据集id,第三个id很清楚,是分块id。

4.获取所有分块
