Dify 1.1.0 元数据过滤保姆级教程:概念全方位解读与实战应用

Dify 1.1.0 是继1.0版本发布以来的第一个重大更新版本,除了日常的bug修复和功能迭代之外,还增加了一个重磅功能:元数据过滤。

由于1.1.0版本出来的时候,测试元数据过滤功能发现还有些问题,直到这次1.1.2版本出来后,测试发现没问题了。

今天就带大家认识一下:什么是元数据?什么是元数据过滤?以及元数据过滤功能实操教程!

一、什么是元数据?

通俗来说,可以将 "元数据" 理解为你为知识库文档设置的一个个属性,比如:隐私级别,作者,分类等等。一个文档可以有多个属性。其实元数据在我们生活中处处存在,知识大家不知道他的专业名称而已。

我们通过图片来理解,可能大家就理解了:

元数据是用来描述一个实体的基本属性信息的,在操作系统内,所有文件几乎都有一些固定的字段信息:类型,作者,大小,修改信息

我们回到Dify系统内,每个知识库文档,Dify都为其内置好了一些固定的元数据,这些元数据我们是不能手动改修改的,由系统自动生成,叫做:内置元数据

dify还为我们增加了一个入口来由我们自定义设置一些文档元数据,我们叫做:自定义元数据。

自定义元数据自由定义,修改,删除。

二、什么是元数据过滤?

元数据过滤,就是查询时,系统会先基于这些文档的元数据进行第一步过滤,这个筛选是文档级别的,不需要深入文档内部,所以效率极高。

如果筛选出对应的文档,才会继续进入文档去查找匹配的数据。

如果元数据皮皮诶未成功,系统就不会再深入文档去查询了,节省了不必要的查询。

官方给出的一张图片很形象,大家可以看下:

三、通过实战来认识元数据过滤?

一)两张数据表

二)给知识库文档设置元数据

设置元数据可以按文档单独设置,也可以批量设置,本案例使用单文档设置的方式,更直观,批量设置元数据的方式,可以在列表页面勾选文档,批量添加,大家可以举一反三。

1、进入文档内部给文档设置隐私级别

2、新建元数据字段

3、设置元数据值

4、设置隐私级别和其他元数据

销售业绩总览表的隐私级别设置为最高:即:level=10

author:阿坡

5、设置工作任务完成情况表的元数据

按照销售业绩总览表的步骤,自行设置隐私级别设置为最高:即:level=1

author:阿坡

三)元数据过滤功能禁用时的效果

四)设置元数据过滤的效果

四、Dify 最新版 v1.1.2一键安装包安装包

注:Dify v1.1.2版本一键安装包已经上传至网盘,下载链接自取方式:

五、总结

元数据过滤功能非常有价值,应用场景也很丰富,本文案例知识抛砖引玉,用一个极其简单的场景,让大家学会使用这一功能,大家学完后,可以举一反三,应用到更多场景,尤其是关于数据的更加细致颗粒度的访问控制场景,非常有用!

如果有任何问题,欢迎联系我~

相关推荐
DyLatte1 小时前
工作中遇到针对自己的同事,该怎么办?
程序员
小华同学ai1 小时前
17.1K star!两小时就能训练出专属于自己的个性化小模型,这个开源项目让AI触手可及!
算法·程序员·github
sakibcc4 小时前
Cursor使用指南
前端·程序员·cursor
这里有鱼汤5 小时前
一篇文章搞定Python数据分析用到的所有库
后端·python·程序员
这里有鱼汤5 小时前
Python自动化办公宝典,一篇文章搞定文档处理:PDF、Word、Excel文档全攻略
后端·python·程序员
阿兰哥5 小时前
【架构篇2】组件化方案及步骤
程序员
欧达克6 小时前
ElasticSearch索引别名,你会用吗?
程序员·架构
Goboy6 小时前
基于PyTorch 实现一个基于 Transformer 架构的字符级语言模型
后端·程序员·架构
一只爱撸猫的程序猿1 天前
Spring Boot整合MySQL主从集群同步延迟解决方案
spring boot·mysql·程序员
用户346302538681 天前
鸿蒙应用开发之“一次开发,多端部署”
程序员