Dify 1.1.0 是继1.0版本发布以来的第一个重大更新版本,除了日常的bug修复和功能迭代之外,还增加了一个重磅功能:元数据过滤。
由于1.1.0版本出来的时候,测试元数据过滤功能发现还有些问题,直到这次1.1.2版本出来后,测试发现没问题了。
今天就带大家认识一下:什么是元数据?什么是元数据过滤?以及元数据过滤功能实操教程!
一、什么是元数据?
通俗来说,可以将 "元数据" 理解为你为知识库文档设置的一个个属性,比如:隐私级别,作者,分类等等。一个文档可以有多个属性。其实元数据在我们生活中处处存在,知识大家不知道他的专业名称而已。
我们通过图片来理解,可能大家就理解了:
元数据是用来描述一个实体的基本属性信息的,在操作系统内,所有文件几乎都有一些固定的字段信息:类型,作者,大小,修改信息
我们回到Dify系统内,每个知识库文档,Dify都为其内置好了一些固定的元数据,这些元数据我们是不能手动改修改的,由系统自动生成,叫做:内置元数据
dify还为我们增加了一个入口来由我们自定义设置一些文档元数据,我们叫做:自定义元数据。
自定义元数据自由定义,修改,删除。
二、什么是元数据过滤?
元数据过滤,就是查询时,系统会先基于这些文档的元数据进行第一步过滤,这个筛选是文档级别的,不需要深入文档内部,所以效率极高。
如果筛选出对应的文档,才会继续进入文档去查找匹配的数据。
如果元数据皮皮诶未成功,系统就不会再深入文档去查询了,节省了不必要的查询。
官方给出的一张图片很形象,大家可以看下:
三、通过实战来认识元数据过滤?
一)两张数据表
二)给知识库文档设置元数据
设置元数据可以按文档单独设置,也可以批量设置,本案例使用单文档设置的方式,更直观,批量设置元数据的方式,可以在列表页面勾选文档,批量添加,大家可以举一反三。
1、进入文档内部给文档设置隐私级别
2、新建元数据字段
3、设置元数据值
4、设置隐私级别和其他元数据
销售业绩总览表的隐私级别设置为最高:即:level=10
author:阿坡
5、设置工作任务完成情况表的元数据
按照销售业绩总览表的步骤,自行设置隐私级别设置为最高:即:level=1
author:阿坡
三)元数据过滤功能禁用时的效果
四)设置元数据过滤的效果
四、Dify 最新版 v1.1.2一键安装包安装包
注:Dify v1.1.2版本一键安装包已经上传至网盘,下载链接自取方式:
五、总结
元数据过滤功能非常有价值,应用场景也很丰富,本文案例知识抛砖引玉,用一个极其简单的场景,让大家学会使用这一功能,大家学完后,可以举一反三,应用到更多场景,尤其是关于数据的更加细致颗粒度的访问控制场景,非常有用!
如果有任何问题,欢迎联系我~