Dify 1.1.0 元数据过滤保姆级教程:概念全方位解读与实战应用

Dify 1.1.0 是继1.0版本发布以来的第一个重大更新版本,除了日常的bug修复和功能迭代之外,还增加了一个重磅功能:元数据过滤。

由于1.1.0版本出来的时候,测试元数据过滤功能发现还有些问题,直到这次1.1.2版本出来后,测试发现没问题了。

今天就带大家认识一下:什么是元数据?什么是元数据过滤?以及元数据过滤功能实操教程!

一、什么是元数据?

通俗来说,可以将 "元数据" 理解为你为知识库文档设置的一个个属性,比如:隐私级别,作者,分类等等。一个文档可以有多个属性。其实元数据在我们生活中处处存在,知识大家不知道他的专业名称而已。

我们通过图片来理解,可能大家就理解了:

元数据是用来描述一个实体的基本属性信息的,在操作系统内,所有文件几乎都有一些固定的字段信息:类型,作者,大小,修改信息

我们回到Dify系统内,每个知识库文档,Dify都为其内置好了一些固定的元数据,这些元数据我们是不能手动改修改的,由系统自动生成,叫做:内置元数据

dify还为我们增加了一个入口来由我们自定义设置一些文档元数据,我们叫做:自定义元数据。

自定义元数据自由定义,修改,删除。

二、什么是元数据过滤?

元数据过滤,就是查询时,系统会先基于这些文档的元数据进行第一步过滤,这个筛选是文档级别的,不需要深入文档内部,所以效率极高。

如果筛选出对应的文档,才会继续进入文档去查找匹配的数据。

如果元数据皮皮诶未成功,系统就不会再深入文档去查询了,节省了不必要的查询。

官方给出的一张图片很形象,大家可以看下:

三、通过实战来认识元数据过滤?

一)两张数据表

二)给知识库文档设置元数据

设置元数据可以按文档单独设置,也可以批量设置,本案例使用单文档设置的方式,更直观,批量设置元数据的方式,可以在列表页面勾选文档,批量添加,大家可以举一反三。

1、进入文档内部给文档设置隐私级别

2、新建元数据字段

3、设置元数据值

4、设置隐私级别和其他元数据

销售业绩总览表的隐私级别设置为最高:即:level=10

author:阿坡

5、设置工作任务完成情况表的元数据

按照销售业绩总览表的步骤,自行设置隐私级别设置为最高:即:level=1

author:阿坡

三)元数据过滤功能禁用时的效果

四)设置元数据过滤的效果

四、Dify 最新版 v1.1.2一键安装包安装包

注:Dify v1.1.2版本一键安装包已经上传至网盘,下载链接自取方式:

五、总结

元数据过滤功能非常有价值,应用场景也很丰富,本文案例知识抛砖引玉,用一个极其简单的场景,让大家学会使用这一功能,大家学完后,可以举一反三,应用到更多场景,尤其是关于数据的更加细致颗粒度的访问控制场景,非常有用!

如果有任何问题,欢迎联系我~

相关推荐
玩转AGI2 天前
【必收藏】12-Factor Agents:让大模型Agent从能跑起来到能用起来的企业级设计指南
人工智能·程序员·llm
tinker2 天前
ROS2 - SLAM 同步定位与建图
程序员
小爱同学_5 天前
一次面试让我重新认识了 Cursor
前端·面试·程序员
彼日花6 天前
前端新人30天:从手足无措到融入团队
前端·程序员
你的人类朋友6 天前
【操作系统】说说 x86 和 x64
后端·程序员·操作系统
AI大模型7 天前
构建可用于生产环境的 RAG 智能体:开发者完整指南
程序员·llm·agent
SimonKing7 天前
GitHub 标星 370k!免费编程资源大合集,从此自学不花一分钱
java·后端·程序员
韦德说7 天前
副业整整一周年:从产品交付到市场运营的真实经验分享
程序员·开源·产品
AI绘画哇哒哒7 天前
实战:SQL统一访问200+数据源,构建企业级智能检索与RAG系统(下)
人工智能·sql·深度学习·学习·ai·程序员·大模型
AI大模型8 天前
别再把RAG当记忆:这5个开源引擎让AI真正会记住
程序员·llm·agent