AI——Dify上传 PDF/Word 打造私有文档问答机器人

上传 PDF/Word 打造私有文档问答机器人

一、前言

在完成聊天机器人基础搭建后,本篇进入 Dify 最核心、最实用的 RAG 功能 。通过上传本地 PDF/Word/TXT 文档,让 AI 只依据你的文件回答,不编造、不幻觉,打造专属私有知识问答机器人。

二、RAG 基本说明

RAG(检索增强生成):先从文档中检索相关内容,再交给 AI 生成回答,确保答案来源可追溯、内容准确、不胡编

支持格式:

  • PDF
  • Word(docx)
  • TXT
  • Excel
  • Markdown

三、第一步:创建知识库

  1. 左侧菜单点击 知识库
  2. 点击 新建知识库
  3. 填写信息:
    • 知识库名称:如「公司制度库」「产品文档库」「学习资料库」
    • 选择检索模式:混合检索(语义+关键词)
  4. 点击 创建

四、第二步:上传文档

  1. 进入刚创建的知识库
  2. 点击 上传文件
  3. 选择本地 PDF / Word / TXT 等文件
  4. 等待自动解析、分段、向量化

上传完成后显示:处理完成,即可使用。

五、第三步:将知识库关联到 AI 应用

  1. 进入你创建的 聊天助手应用
  2. 找到 上下文设置 → 知识库
  3. 开启 启用知识库检索
  4. 选择刚才创建的知识库
  5. 配置参数(新手默认即可):
    • 最大召回条数:3~5
    • 相似度阈值:0.7
  6. 点击 保存

六、第四步:配置提示词(强制 AI 只看文档)

在系统提示词中加入以下规则,让 AI 不编造、只依据文档回答

复制代码
你只能根据提供的知识库内容回答问题。
如果文档中没有答案,必须回复:未找到相关信息。
要求回答简洁、准确、不扩展、不编造。

七、第五步:调试问答

在右侧调试窗口提问:

  • 文档里的内容 → AI 精准回答
  • 文档里没有的内容 → AI 回复:未找到相关信息

实现100% 基于文档回答,无幻觉。

八、常用优化技巧

  1. 回答不准确
    • 调整召回数量:改为 5~10
    • 提高相似度阈值:0.75~0.85
  2. 文档太大、解析乱码
    • 拆分成小文件上传
  3. AI 仍然编造
    • 加强提示词约束
    • 关闭"网络搜索"等无关功能

九、发布使用

配置完成后点击 发布,即可:

  • 公开网页访问
  • 嵌入官网作为智能客服
  • 通过 API 对接业务系统
相关推荐
sinat_286945191 小时前
llm wiki
人工智能·算法·chatgpt
a8057626871 小时前
Luston.ai深度评测:沉浸式AI虚拟陪伴,普通与18+双模式全体验
人工智能
Kiyra1 小时前
Agent 的记忆不是存数据库就行:上下文预算与轻量记忆的设计实战
数据库·人工智能·后端·面试·职场和发展·哈希算法
agicall.com1 小时前
信电助 - 信创无线盒 UB-W-XC 型号功能列表
人工智能·语音识别·信创电话助手·座机语音转文字·固话座机录音转文字
昨夜见军贴06161 小时前
爆破冲击试验越来越严格,AI报告审核如何借助IACheck守住安全底线
人工智能·安全
TEC_INO1 小时前
Linux_54:RV1126的VI模块讲解
linux·运维·人工智能
mit6.8241 小时前
20种Agent 设计模式
人工智能·设计模式
张二娃同学1 小时前
专栏第01篇_深度学习导论
人工智能·python·深度学习·cnn
ConardLi1 小时前
Harness 实践:让 Agent 全自动制作知识讲解视频
前端·人工智能·后端