📚 Open WebUI 知识库配置详细步骤(中英文对照)
🌐 界面语言切换
            
            
              bash
              
              
            
          
          # 首次登录后切换语言:
1. 点击左下角用户头像 → Settings
2. 在 "General" 选项卡找到 "Language"
3. 选择 中文(简体)/English
4. 点击 "Save"
        🔧 一、上传文档(知识库创建)
| 步骤 | 中文界面 | English Interface | 操作说明 | 
|---|---|---|---|
| 1 | 左侧菜单 → 工作空间 → 知识库 | Left Menu → WorkSpace → Knowledge | 进入知识库管理页面 | 
| 2 | 点击 + 新建知识库 | 
Click + New Knowledge Base | 
创建新知识库容器 | 
| 3 | 输入知识库名称 (如"产品手册") | Enter name (e.g."Product Docs") | 仅支持英文/数字命名 | 
| 4 | 点击 上传文件 | 
Click Upload Files | 
打开文件选择对话框 | 
| 5 | 选择文档 (PDF/DOCX/TXT/MD) | Select files (支持多选) | 最大20MB/文件 | 
| 6 | 确认上传 → 等待处理完成 | Confirm → Wait for processing | 状态栏显示处理进度 | 
1. 前提条件
- 已安装 Open WebUI 0.6.13(通过 Docker 或 pip 安装)。
 - 已配置本地大语言模型(如 Ollama、DeepSeek 或 Hugging Face 模型)。
 - 确保已启动相关依赖服务(如 Ollama)。
 
2. 创建知识库
步骤 1:进入工作空间
- 登录 Open WebUI 后,点击左侧导航栏的 工作空间。
 - 在 知识库 子菜单下,点击 + 新建知识库。
 
步骤 2:配置知识库基本信息
- 名称 :输入知识库名称(如 
公司政策)。 - 描述:简要说明知识库用途(可选)。
 - 模型选择 :
- 在 模型 下拉菜单中选择已配置的本地模型(如 
deepseek-r1)。 - 注意:此版本无 RAG 菜单项,需通过模型绑定实现知识库功能。
 
 - 在 模型 下拉菜单中选择已配置的本地模型(如 
 
步骤 3:上传文档
- 点击 上传文档 ,支持以下格式:
- 文本文件(
.txt) - PDF 文件(
.pdf) - Markdown 文件(
.md) 
 - 文本文件(
 - 上传后,系统会自动解析并生成索引(无需手动触发)。
 
步骤 4:验证知识库
- 在对话界面选择已绑定的模型(如 
test_model)。 - 输入与上传文档相关的问题,观察是否返回知识库中的内容。
 - 若未返回结果,检查日志(路径:设置 > 日志)排查解析错误。
 
⚠️ 注意:中文文档需确认编码为 UTF-8,否则会出现乱码
⚙️ 二、高级配置(核心设置)
配置语义向量模型
- 进入 设置 > 管理员设置 > 文档。
 - 在 语义向量模型 部分:
- 模型引擎 :选择 
Ollama或HuggingFace。 - 模型名称 :输入已部署的模型名称(如 
bge-large)。 
 - 模型引擎 :选择 
 - 保存配置并重启服务生效。
 
调整存储路径
- 
修改配置文件(如
config.yaml):yamlknowledge_base: storage_path: "/your/custom/path" 
文件上传限制
修改上传限制(如 config.yaml):
            
            
              yaml
              
              
            
          
          upload:
  allowed_extensions: [".pdf", ".txt", ".md"]
  max_file_size: 100000000  # 100MB
        重启 Open WebUI 服务:
⚡ 三、高级设置(文本处理优化)
中英文通用配置位置:
高级选项 → 文本处理
| 参数 | 推荐值 | 说明 | 
|---|---|---|
| 分块大小/chunk_size | 1024 | 文本切片长度(token数) | 
| 分块重叠/chunk_overlap | 128 | 切片间重叠避免信息割裂 | 
| 元数据提取 | ☑ 启用 | 提取标题/作者等关键信息 | 
| 中文专用分词器 | ☑ 启用 | 提升中文文档处理精度 (中文界面) | 
| Chinese Tokenizer | ☑ Enable | Optimize Chinese processing (英文界面) | 
            
            
              yaml
              
              
            
          
          # 配置文件示例
chunking:
  size: 1024
  overlap: 128
metadata_extraction: true
language_optimization:
  zh: true  # 中文优化
        🎯 四、领域指令设置(Prompt 优化)
中文界面路径:
高级选项 → 指令模板
            
            
              plaintext
              
              
            
          
          [系统] 你是一个{domain}领域专家,请根据知识库内容回答。
回答要求:
1. 使用专业术语
2. 引用来源片段
3. 不确定时回复"根据现有资料无法确定"
当前领域:医疗/法律/金融 (手动修改)
        English Interface Path:
Advanced → Instruction Template
            
            
              plaintext
              
              
            
          
          [System] You are a {domain} specialist. Answer based strictly on knowledge base.
Requirements:
1. Use professional terminology
2. Cite source snippets
3. Respond "Unanswerable" when uncertain
Current Domain: Medical/Legal/Finance (Edit manually)
        ✅ 五、验证与测试
- 
知识库状态检查
- 
中文路径:
知识库详情 → 处理日志 - 
英文路径:
Knowledge Details → Processing Logs - 
成功标志:
plaintext✅ 文档解析完成 ✅ 向量生成: X 个分块 
 - 
 - 
问答测试
plaintext测试问题示例: 中文:"产品X的主要功能是什么?" English: "What are the main features of Product X?" - 
结果验证
- 
点击回答区域的
来源/Sources标签 - 
检查:
plaintext1. 引用片段是否相关 2. 页码标注是否准确 3. 领域术语使用是否正确 
 - 
 
💡 性能提示:首次检索较慢(需加载模型),后续请求响应应在 2-5 秒内
© 著作权归作者所有