AI——Dify上传 PDF/Word 打造私有文档问答机器人

上传 PDF/Word 打造私有文档问答机器人

一、前言

在完成聊天机器人基础搭建后,本篇进入 Dify 最核心、最实用的 RAG 功能 。通过上传本地 PDF/Word/TXT 文档,让 AI 只依据你的文件回答,不编造、不幻觉,打造专属私有知识问答机器人。

二、RAG 基本说明

RAG(检索增强生成):先从文档中检索相关内容,再交给 AI 生成回答,确保答案来源可追溯、内容准确、不胡编

支持格式:

  • PDF
  • Word(docx)
  • TXT
  • Excel
  • Markdown

三、第一步:创建知识库

  1. 左侧菜单点击 知识库
  2. 点击 新建知识库
  3. 填写信息:
    • 知识库名称:如「公司制度库」「产品文档库」「学习资料库」
    • 选择检索模式:混合检索(语义+关键词)
  4. 点击 创建

四、第二步:上传文档

  1. 进入刚创建的知识库
  2. 点击 上传文件
  3. 选择本地 PDF / Word / TXT 等文件
  4. 等待自动解析、分段、向量化

上传完成后显示:处理完成,即可使用。

五、第三步:将知识库关联到 AI 应用

  1. 进入你创建的 聊天助手应用
  2. 找到 上下文设置 → 知识库
  3. 开启 启用知识库检索
  4. 选择刚才创建的知识库
  5. 配置参数(新手默认即可):
    • 最大召回条数:3~5
    • 相似度阈值:0.7
  6. 点击 保存

六、第四步:配置提示词(强制 AI 只看文档)

在系统提示词中加入以下规则,让 AI 不编造、只依据文档回答

复制代码
你只能根据提供的知识库内容回答问题。
如果文档中没有答案,必须回复:未找到相关信息。
要求回答简洁、准确、不扩展、不编造。

七、第五步:调试问答

在右侧调试窗口提问:

  • 文档里的内容 → AI 精准回答
  • 文档里没有的内容 → AI 回复:未找到相关信息

实现100% 基于文档回答,无幻觉。

八、常用优化技巧

  1. 回答不准确
    • 调整召回数量:改为 5~10
    • 提高相似度阈值:0.75~0.85
  2. 文档太大、解析乱码
    • 拆分成小文件上传
  3. AI 仍然编造
    • 加强提示词约束
    • 关闭"网络搜索"等无关功能

九、发布使用

配置完成后点击 发布,即可:

  • 公开网页访问
  • 嵌入官网作为智能客服
  • 通过 API 对接业务系统
相关推荐
weixin_468466856 小时前
Ava 2.0 智能应用场景落地指南
人工智能·自然语言处理·大模型·智能交互·ava
John_ToDebug6 小时前
MCP 深度解析:大模型的“万能插头”
人工智能·经验分享·ai
浦信仿真大讲堂6 小时前
CST 仿真软件与 AI 融合的工程应用实战
人工智能·仿真软件·达索仿真·达索软件
mit6.8246 小时前
A Software Engineer‘s Apology | CODA
人工智能
段一凡-华北理工大学6 小时前
2026 高炉炼铁智能化技术全景与演进路径~系列文章11:演进路径与行业未来
大数据·网络·人工智能·算法·工业智能体·高炉炼铁智能化
小脑斧1237 小时前
AI技能化落地:从对话式大模型到可生产、可复用的AI工程体系
人工智能·skills·openclaw·hermes·marvis
西陵7 小时前
Agent 为什么会陷入 Doom Loop?OpenClaw 的破解之道
前端·人工智能·ai编程
飞哥数智坊7 小时前
动动嘴皮子就把事干了,Mic Air + TRAE SOLO 让我越来越懒
人工智能
喜欢踢足球的老罗7 小时前
从移动开发转型 AI Agent 工程师:我做了一个开源学习系统
人工智能·学习
武汉唯众智创7 小时前
AI智能心理筛查拆解:三级漏斗式筛查算法+行业理论落地
人工智能·ai心理健康·校园心理健康·学生心理健康解决方案·校园心理健康平台·心理筛查