Dify 1.1.0 元数据过滤保姆级教程:概念全方位解读与实战应用

Dify 1.1.0 是继1.0版本发布以来的第一个重大更新版本,除了日常的bug修复和功能迭代之外,还增加了一个重磅功能:元数据过滤。

由于1.1.0版本出来的时候,测试元数据过滤功能发现还有些问题,直到这次1.1.2版本出来后,测试发现没问题了。

今天就带大家认识一下:什么是元数据?什么是元数据过滤?以及元数据过滤功能实操教程!

一、什么是元数据?

通俗来说,可以将 "元数据" 理解为你为知识库文档设置的一个个属性,比如:隐私级别,作者,分类等等。一个文档可以有多个属性。其实元数据在我们生活中处处存在,知识大家不知道他的专业名称而已。

我们通过图片来理解,可能大家就理解了:

元数据是用来描述一个实体的基本属性信息的,在操作系统内,所有文件几乎都有一些固定的字段信息:类型,作者,大小,修改信息

我们回到Dify系统内,每个知识库文档,Dify都为其内置好了一些固定的元数据,这些元数据我们是不能手动改修改的,由系统自动生成,叫做:内置元数据

dify还为我们增加了一个入口来由我们自定义设置一些文档元数据,我们叫做:自定义元数据。

自定义元数据自由定义,修改,删除。

二、什么是元数据过滤?

元数据过滤,就是查询时,系统会先基于这些文档的元数据进行第一步过滤,这个筛选是文档级别的,不需要深入文档内部,所以效率极高。

如果筛选出对应的文档,才会继续进入文档去查找匹配的数据。

如果元数据皮皮诶未成功,系统就不会再深入文档去查询了,节省了不必要的查询。

官方给出的一张图片很形象,大家可以看下:

三、通过实战来认识元数据过滤?

一)两张数据表

二)给知识库文档设置元数据

设置元数据可以按文档单独设置,也可以批量设置,本案例使用单文档设置的方式,更直观,批量设置元数据的方式,可以在列表页面勾选文档,批量添加,大家可以举一反三。

1、进入文档内部给文档设置隐私级别

2、新建元数据字段

3、设置元数据值

4、设置隐私级别和其他元数据

销售业绩总览表的隐私级别设置为最高:即:level=10

author:阿坡

5、设置工作任务完成情况表的元数据

按照销售业绩总览表的步骤,自行设置隐私级别设置为最高:即:level=1

author:阿坡

三)元数据过滤功能禁用时的效果

四)设置元数据过滤的效果

四、Dify 最新版 v1.1.2一键安装包安装包

注:Dify v1.1.2版本一键安装包已经上传至网盘,下载链接自取方式:

五、总结

元数据过滤功能非常有价值,应用场景也很丰富,本文案例知识抛砖引玉,用一个极其简单的场景,让大家学会使用这一功能,大家学完后,可以举一反三,应用到更多场景,尤其是关于数据的更加细致颗粒度的访问控制场景,非常有用!

如果有任何问题,欢迎联系我~

相关推荐
To_OC2 小时前
从一次栈溢出报错说起,我把递归彻底扒明白了
javascript·算法·程序员
烬羽7 小时前
中英文 token 数量差一倍?两段 JS 代码搞懂 LLM 底层是怎么"读"文字的
javascript·程序员·架构
Patrick_Wilson8 小时前
Squash Merge 的血缘陷阱:为什么删掉的代码又活了过来
前端·git·程序员
程序员cxuan10 小时前
GPT-5.6 还不发布?不过大家可以先看看 Codex 的白皮书。
人工智能·后端·程序员
Apifox10 小时前
从 Postman 迁移到 Apifox:Workspace、Collection、Environment 现在可以一起导入了
前端·后端·程序员
陈随易13 小时前
VSCode古法神器fnMap v9开发故事
前端·后端·程序员
AskHarries14 小时前
插件权限、安装、升级和版本兼容
程序员
字节跳动数据库15 小时前
文章分享——庖丁解牛-图解查询分析和调优利器Optimizer Trace
人工智能·程序员
码流怪侠1 天前
【GitHub】Ponytail:给 AI 编码代理植入“懒人资深开发者“灵魂的开源插件深度拆解
程序员·github·ai编程
秦先生在广东1 天前
Claude Code 最佳实践:从"氛围编程"到智能体工程
程序员