AI——Dify上传 PDF/Word 打造私有文档问答机器人

上传 PDF/Word 打造私有文档问答机器人

一、前言

在完成聊天机器人基础搭建后,本篇进入 Dify 最核心、最实用的 RAG 功能 。通过上传本地 PDF/Word/TXT 文档,让 AI 只依据你的文件回答,不编造、不幻觉,打造专属私有知识问答机器人。

二、RAG 基本说明

RAG(检索增强生成):先从文档中检索相关内容,再交给 AI 生成回答,确保答案来源可追溯、内容准确、不胡编

支持格式:

  • PDF
  • Word(docx)
  • TXT
  • Excel
  • Markdown

三、第一步:创建知识库

  1. 左侧菜单点击 知识库
  2. 点击 新建知识库
  3. 填写信息:
    • 知识库名称:如「公司制度库」「产品文档库」「学习资料库」
    • 选择检索模式:混合检索(语义+关键词)
  4. 点击 创建

四、第二步:上传文档

  1. 进入刚创建的知识库
  2. 点击 上传文件
  3. 选择本地 PDF / Word / TXT 等文件
  4. 等待自动解析、分段、向量化

上传完成后显示:处理完成,即可使用。

五、第三步:将知识库关联到 AI 应用

  1. 进入你创建的 聊天助手应用
  2. 找到 上下文设置 → 知识库
  3. 开启 启用知识库检索
  4. 选择刚才创建的知识库
  5. 配置参数(新手默认即可):
    • 最大召回条数:3~5
    • 相似度阈值:0.7
  6. 点击 保存

六、第四步:配置提示词(强制 AI 只看文档)

在系统提示词中加入以下规则,让 AI 不编造、只依据文档回答

复制代码
你只能根据提供的知识库内容回答问题。
如果文档中没有答案,必须回复:未找到相关信息。
要求回答简洁、准确、不扩展、不编造。

七、第五步:调试问答

在右侧调试窗口提问:

  • 文档里的内容 → AI 精准回答
  • 文档里没有的内容 → AI 回复:未找到相关信息

实现100% 基于文档回答,无幻觉。

八、常用优化技巧

  1. 回答不准确
    • 调整召回数量:改为 5~10
    • 提高相似度阈值:0.75~0.85
  2. 文档太大、解析乱码
    • 拆分成小文件上传
  3. AI 仍然编造
    • 加强提示词约束
    • 关闭"网络搜索"等无关功能

九、发布使用

配置完成后点击 发布,即可:

  • 公开网页访问
  • 嵌入官网作为智能客服
  • 通过 API 对接业务系统
相关推荐
ZhengEnCi4 小时前
09bad-斯坦福CS336作业一-构建优化器
人工智能
哥不是小萝莉5 小时前
一文读懂 OpenAI Codex 源码的原理、架构与未来
ai
ZhengEnCi5 小时前
09bac-斯坦福CS336作业一-实现训练损失计算
人工智能
冬奇Lab5 小时前
Skill 系列(01):Skill 评测体系——如何量化一个 AI Skill 的质量
人工智能
IT_陈寒8 小时前
Redis内存爆了,原来我漏掉了这个致命配置
前端·人工智能·后端
用户35218024547510 小时前
🎆从 Prompt 到 Skill:让 Spring AI Agent 学会"装新技能"
人工智能·spring boot·ai编程
米小虾10 小时前
手把手教你搭建第一个生产级AI Agent:从选型到实战的完整指南
人工智能·agent
任沫10 小时前
Agent之Function Call
javascript·人工智能·go
米小虾11 小时前
2026年AI Agent全面爆发:从开源生态到企业级应用的进化之路
人工智能·agent
用户69190268133911 小时前
Vibe Coding 开发项目的基本范式
人工智能·设计模式·代码规范