DeepSeek12-Open WebUI 知识库配置详细步骤

📚 Open WebUI 知识库配置详细步骤（中英文对照）

🌐 界面语言切换

bash 复制代码

# 首次登录后切换语言：
1. 点击左下角用户头像 → Settings
2. 在 "General" 选项卡找到 "Language"
3. 选择 中文(简体)/English
4. 点击 "Save"

🔧 一、上传文档（知识库创建）

步骤	中文界面	English Interface	操作说明
1	左侧菜单 → 工作空间 → 知识库	Left Menu → WorkSpace → Knowledge	进入知识库管理页面
2	点击 `+ 新建知识库`	Click `+ New Knowledge Base`	创建新知识库容器
3	输入知识库名称 (如"产品手册")	Enter name (e.g."Product Docs")	仅支持英文/数字命名
4	点击 `上传文件`	Click `Upload Files`	打开文件选择对话框
5	选择文档 (PDF/DOCX/TXT/MD)	Select files (支持多选)	最大20MB/文件
6	确认上传 → 等待处理完成	Confirm → Wait for processing	状态栏显示处理进度

1. 前提条件

已安装 Open WebUI 0.6.13（通过 Docker 或 pip 安装）。
已配置本地大语言模型（如 Ollama、DeepSeek 或 Hugging Face 模型）。
确保已启动相关依赖服务（如 Ollama）。

2. 创建知识库

步骤 1：进入工作空间

登录 Open WebUI 后，点击左侧导航栏的 工作空间。
在 知识库 子菜单下，点击 + 新建知识库。

步骤 2：配置知识库基本信息

名称：输入知识库名称（如 公司政策）。
描述：简要说明知识库用途（可选）。
模型选择 ：
- 在模型下拉菜单中选择已配置的本地模型（如 deepseek-r1）。
- 注意：此版本无 RAG 菜单项，需通过模型绑定实现知识库功能。

步骤 3：上传文档

点击 上传文档 ，支持以下格式：
- 文本文件（.txt）
- PDF 文件（.pdf）
- Markdown 文件（.md）
上传后，系统会自动解析并生成索引（无需手动触发）。

步骤 4：验证知识库

在对话界面选择已绑定的模型（如 test_model）。
输入与上传文档相关的问题，观察是否返回知识库中的内容。
若未返回结果，检查日志（路径：设置 > 日志）排查解析错误。

⚠️ 注意：中文文档需确认编码为 UTF-8，否则会出现乱码

⚙️ 二、高级配置（核心设置）

配置语义向量模型

进入设置 > 管理员设置 > 文档。
在 语义向量模型 部分：
- 模型引擎 ：选择 Ollama 或 HuggingFace。
- 模型名称 ：输入已部署的模型名称（如 bge-large）。
保存配置并重启服务生效。

调整存储路径

修改配置文件（如 config.yaml）：
yaml 复制代码
```
knowledge_base:
  storage_path: "/your/custom/path"
```

文件上传限制

修改上传限制（如 config.yaml）：

yaml 复制代码

upload:
  allowed_extensions: [".pdf", ".txt", ".md"]
  max_file_size: 100000000  # 100MB

重启 Open WebUI 服务：

⚡ 三、高级设置（文本处理优化）

中英文通用配置位置：

高级选项 → 文本处理

参数	推荐值	说明
分块大小/chunk_size	1024	文本切片长度（token数）
分块重叠/chunk_overlap	128	切片间重叠避免信息割裂
元数据提取	☑ 启用	提取标题/作者等关键信息
中文专用分词器	☑ 启用	提升中文文档处理精度 (中文界面)
Chinese Tokenizer	☑ Enable	Optimize Chinese processing (英文界面)

yaml 复制代码

# 配置文件示例
chunking:
  size: 1024
  overlap: 128
metadata_extraction: true
language_optimization:
  zh: true  # 中文优化

🎯 四、领域指令设置（Prompt 优化）

中文界面路径：

高级选项 → 指令模板

plaintext 复制代码

[系统] 你是一个{domain}领域专家，请根据知识库内容回答。
回答要求：
1. 使用专业术语
2. 引用来源片段
3. 不确定时回复"根据现有资料无法确定"
当前领域：医疗/法律/金融 (手动修改)

English Interface Path:

Advanced → Instruction Template

plaintext 复制代码

[System] You are a {domain} specialist. Answer based strictly on knowledge base.
Requirements:
1. Use professional terminology
2. Cite source snippets
3. Respond "Unanswerable" when uncertain
Current Domain: Medical/Legal/Finance (Edit manually)

✅ 五、验证与测试

知识库状态检查
- 中文路径：知识库详情 → 处理日志
- 英文路径：Knowledge Details → Processing Logs
- 成功标志：
  plaintext 复制代码
```
✅ 文档解析完成
✅ 向量生成: X 个分块
```

问答测试

plaintext 复制代码

测试问题示例：
中文："产品X的主要功能是什么？"
English: "What are the main features of Product X?"

结果验证

点击回答区域的 来源/Sources 标签

检查：

plaintext 复制代码

1. 引用片段是否相关
2. 页码标注是否准确
3. 领域术语使用是否正确

💡 性能提示：首次检索较慢（需加载模型），后续请求响应应在 2-5 秒内