前言
上篇文章《低代码Agent开发框架使用指南(七)---Coze 数据库详解》中,笔者详细介绍了如何在Coze平台中创建和使用数据库,并结合可视化图表完成了一个数据分析任务。除了能够高效处理结构化数据之外,作为一款功能强大的低代码开发平台,Coze同样支持对文档、表格、图片等非结构化数据进行管理与调用------这正是Coze知识库功能的核心价值所在。
低代码Agent开发相关文章已全部收录于笔者专栏《AI应用工厂:低代码智能体开发使用指南》。本专栏致力于帮助零代码经验的朋友快速上手智能体搭建,学会该技能可以轻松实现如旅游助手、自动文档处理、自动视频生成等实用工具,让大模型技术真正赋能日常生活。
对于有编程基础、喜欢写代码的开发者也可以阅读笔者的LangChain/LangGraph系列教程专栏。该专栏融合了笔者在实战中积累的深度经验,系统讲解如何基于LangChain与LangGraph框架高效开发智能体,并通过众多实战项目助大家快速构建专业级应用。大家感兴趣可以关注笔者掘金账号和系列专栏,更可关注笔者同名微信公众号: 大模型真好玩 , 每期分享涉及的代码均可在公众号私信: LangChain智能体开发获得。
一、什么是知识库?
1.1 知识库概念
在介绍Coze知识库的具体使用方法之前,笔者先分享什么是知识库。知识库是一种用于存储、管理和应用海量结构化、非结构化数据的系统。它通过对信息进行系统性的收集、组织、分类和索引,帮助用户高效地检索和利用相关知识。Coze的知识库功能正是基于这一理念,为用户提供了一套完整的知识管理解决方案。
为了让大家更直观地理解,笔者这里举一个简单的例子。假设上传的文档中包含这样两句话:"AAA是一个AI产品经理"和"BBB是一个AI程序员"。Coze知识库会先将文档切分为两个分段,分别对应这两句话。当用户提问"AAA是谁"时,知识库会通过语义相似度匹配到第一句话"AAA是一个AI产品经理",然后将这段内容交给大模型。大模型基于这句话进行回答:"据我所知,AAA是一个AI产品经理。"
关于知识库背后更深入的技术原理,特别是RAG(检索增强生成)的核心机制,大家可以参考笔者的另一篇文章《一文带你了解RAG核心原理!不再只是文档的搬运工》,这里就不再详细展开。
1.2 Coze知识库核心功能
Coze知识库提供了一种简单易用的方式,帮助开发者存储、管理和应用外部数据,使智能体能够在特定领域进行专业、准确的对话交互。其主要特点包括:
- 多样化数据源:支持上传本地文件(如.txt、.pdf、.docx、.csv、.xlsx等)、在线网页、API接口数据,并可集成Notion、飞书等多种来源的文本与结构化数据。
- 智能内容分割:上传的文档内容会被自动切分为多个独立的信息片段进行存储(类似上一节中的示例),同时也支持自定义分段规则,如关键词、字符长度等,便于后续更精准地检索与应用。
- 灵活的应用方式:将知识库关联到智能体后,开发者可选择自动调用或按需调用的方式,灵活使用知识库中的内容。
借助Coze知识库,开发者能够以低成本、高效率的方式,让智能体快速掌握各行各业的专业知识,打造个性化的智能服务体验,为客户提供准确的信息支持,为企业创造更多价值。
1.3 Coze知识库的适用场景
Coze知识库适用于多种专业场景,以下列举几个典型应用方向:
- 搭建行业知识专家
针对特定行业构建涵盖各类细分知识点的知识库,使智能体迅速成为该领域的专家。例如,为汽车行业建立车型参数知识库,机器人即可详细解答每款车型的具体配置;为医疗行业上传疾病百科,智能体就能提供专业的医疗咨询服务。 - 构建企业产品/服务助手
企业可将产品说明书、操作手册、服务条款等文档导入知识库。当客户咨询相关问题时,智能体能够快速给出权威、准确的回答,实现全天候在线的标准化服务,有效提升客户体验。 - 打造员工培训与知识问答系统
将岗位手册、业务规范、操作流程等内容上传至知识库后,员工可随时通过对话机器人进行学习。智能体能够根据员工的提问,从知识库中检索最佳答案,在员工培训和知识管理方面发挥重要作用。
二、 Coze知识库使用指南
2.1 知识库的创建和管理
-
进入知识库管理页面: 访问 Coze 空间首页,依次点击左侧菜单栏中的「资源库」→「知识库」标签页,然后点击右上角的「添加资源」按钮,在下拉选项中选择「知识库」。

-
创建知识库并上传文件: 选择创建「扣子知识库」,本次演示将以文本格式上传笔者之前的笔记《DeepSeek高性能部署实战》文档。



-
配置内容解析方式: 上传完成后,由于文档包含文字与图片等多模态内容,需通过 Coze 知识库进行内容提取。系统能够准确识别图片、表格等元素。若为纯文本内容,可选择「快速解析」以加快处理速度。

-
设置分段策略: 开发者可选择系统提供的「自动分段与清洗」功能,或启用「自定义」分段。自动模式下,系统将依据内置规则进行内容切分与噪声清除;自定义模式下,可配置以下参数:
- 分段标识符:设定分段依据的符号或关键词
- 分段最大长度:控制每段包含的文本数量
- 分段重叠:设置相邻段落间的重叠部分,确保内容连续性
- 文本预处理:如去除空白字符、过滤链接等
对于结构化文档,还可选用「按层级分段」模式,系统将依照文档的标题层级自动划分段落。配置完成后,点击「下一步」继续。


-
预览分段结果并完成创建: 系统将依据设定对内容进行自动分段,开发者可实时预览分段结果(此过程可能需要一定时间)。完成后点击「下一步」,Coze 知识库会将每个段落转化为向量形式存储,为后续语义匹配做好准备。


-
完成知识库创建: 确认无误后,点击「确认」按钮,即可成功创建知识库。

- 创建智能体并关联知识库:参考笔者之前的教程《低代码Agent开发框架使用指南(三)---小白5分钟利用Coze轻松构建智能体》创建一个智能体,并将其与刚创建的知识库关联。

-
配置提示词并启用知识库: 利用大模型自动优化提示词,并在编辑框中选择我们创建的知识库《DeepSeek高性能部署实战》。
优化后的提示词案例:
markdown# 角色 你是一个专注于利用知识库信息进行精准回答的智能助手,专门用于测试知识库的功能与信息呈现效果,能够严谨地从知识库中提取相关内容并以清晰易懂的方式回复用户。 ## 技能 ### 技能 1: 知识库优先检索 1. 当用户提问时,**优先调用知识库**中的相关信息进行回答,不主动使用外部工具或自行编造内容; 2. 若知识库中存在直接匹配的信息,需提取核心内容,合并为简洁回答; 3. 若知识库中信息零散或需关联多个知识点,自动进行结构化整合(如分点说明、逻辑串联)。 ===回复示例=== - 🔑 匹配知识点:<知识库中对应词条/模块> - 📌 核心内容:<用1-2句话总结关键信息> - 📊 详细分解:<若信息复杂,按逻辑分点说明,每个点对应知识库中的具体条目> ===示例结束=== ### 技能 2: 知识准确性与完整性验证 1. 对知识库中的信息进行严格校验,确保回复内容与知识库原文一致,不夸大、不删减; 2. 若知识库存在信息冲突或缺失,需明确标注"知识库中存在不同解释"或"相关信息暂未完整收录",不强行整合矛盾内容。 ### 技能 3: 知识场景化解释 1. 针对抽象或专业的知识库内容,使用用户熟悉的逻辑或场景进行类比解释(如生活实例、日常场景映射); 2. 若用户问题涉及多个知识点,主动梳理知识关联逻辑,帮助用户理解知识点间的联系。 ## 限制 - **严格限制知识库范围**:仅基于当前知识库内容回复,不引入外部信息或个性化观点; - **明确边界提示**:当问题超出知识库覆盖范围时(如"我不知道""这个概念不在知识库中"),直接回复"当前问题超出知识库支持范围,建议补充相关知识库内容后再次提问"; - **拒绝无关话题**:不回应与知识库内容无关的问题(如个人经历、娱乐八卦、技术故障等); - **格式规范**:所有回复需按示例中的结构分点,信息密度适中,避免冗长或简略过度。

-
测试知识库检索结果: 提出问题:"高性能部署 DeepSeek 有哪几种方式",智能体将调用知识库并返回相应答案。点击运行完毕的下拉框,可查看知识库搜索的详细信息,包括:
- 与问题相关联的内容块
- 各内容块与问题的相似度评分
- 按相似度从高到低排列的检索结果
测试结果表明,智能体能够准确从知识库中获取相关内容并生成回答,有效扩展了大模型的知识边界,提升了回答的准确性和专业性。


2.2 知识库和变量、长期记忆、数据库的对比
在 Coze 平台中,知识库、变量、长期记忆和数据库都具备数据存储能力,但在使用场景和特性上存在显著差异。我们可以从数据的使用对象和内容性质两个维度进行区分:
- 知识(主要指知识库) :作为供智能体或工作流调用的静态数据,可在空间内共享。这类数据由开发者创建和维护,终端用户仅可读取而无法修改。
- 记忆(包括变量、数据库、长期记忆) :用于存储智能体在与终端用户交互过程中产生的动态数据。这类数据通常与具体用户相关联,不支持跨智能体共享。
以下以一个租房平台智能体为例,说明不同类型数据的存储方式与特点:
| 类别 | 存储的数据 | 特点 |
|---|---|---|
| 知识 | 房源信息、房屋图片、房屋描述、房屋价格、房屋地址、房屋设施、房屋评价等 | 由 智能体 开发者上传和维护、所有用户可见但不可修改、可跨 智能体 使用 |
| 记忆 | 用户信息、用户历史租房信息、用户关注的小区/房屋等 | 用户个人数据,不支持跨 智能体 使用 |
三、总结
Coze知识库作为一套集存储、管理、检索与应用于一体的知识管理解决方案,为智能体的能力提升提供了强有力的支持。然而,知识库的实际效果很大程度上取决于导入内容的质量与相关性。作为使用者,我们需要深入理解其功能特性,结合具体应用场景规划和构建知识体系,并持续优化更新内容,才能充分释放知识库的价值,打造真正懂行业、有深度、高效率的智能助手,为业务创新持续赋能。
本文介绍的内容已能满足基础使用需求,但要充分发挥知识库的潜力,仍需掌握更多构建技巧。本专栏将持续深入这一领域,下篇文章将重点解析Coze知识库的优化方法与高级实践,敬请期待!大家阅读后感兴趣可关注笔者掘金账号和专栏。 低代码Agent开发相关文章已全部收录于笔者专栏《AI应用工厂:低代码智能体开发使用指南》。
对于有经验喜欢写代码的开发者也可以阅读笔者的LangChain/LangGraph系列教程专栏,目前已经更完28节。该专栏融合了笔者在实战中积累的深度经验,系统讲解如何基于LangChain与LangGraph框架高效开发智能体,助你快速构建专业级应用。大家可关注笔者同名微信公众号: 大模型真好玩 , 每期分享涉及的代码均可在公众号私信: LangChain智能体开发获得。