小遥搜索v1.7.0版本更新【飞书文档+知识库支持】

版本预览


v1.7.0 版本更新说明

发布日期 :2026年04月07日
版本类型 :重大功能更新
主题:飞书文档+知识库支持


📋 版本概述

小遥搜索 v1.7.0 正式支持 飞书文档数据源 ,配合小遥搜索飞书导出工具(https://github.com/dtsola/xiaoyaosearch-feishu-export-md),让您能够搜索从飞书导出的本地 Markdown 文档,在搜索结果中清晰标识飞书文档来源,并支持一键跳转到飞书原文。

核心亮点

  • 📄 飞书文档识别:自动识别从飞书导出的 Markdown 文档
  • 🔗 原文链接跳转:搜索结果支持直接跳转到飞书原文
  • 🎨 飞书标识展示:搜索结果中使用紫色"飞书"标识区分数据来源
  • 🔌 插件化架构:基于插件化框架,扩展数据源更灵活
  • 🛠️ 配套导出工具:独立的飞书导出 CLI 工具,支持批量导出

✨ 新增功能

飞书文档数据源支持

功能定位

为小遥搜索添加飞书文档数据源识别能力,让用户能够搜索从飞书导出的本地 Markdown 文档。

使用流程

复制代码
┌─────────────────┐      ┌──────────────────┐      ┌─────────────────┐
│  飞书文档/知识库  │ ───▶ │  飞书导出工具      │ ───▶ │  本地MD文件      │
└─────────────────┘      └──────────────────┘      └─────────────────┘
                                                           │
                                                           ▼
                                                    ┌─────────────────┐
                                                    │  小遥搜索        │
                                                    │  自动识别        │
                                                    └─────────────────┘
                                                           │
                                                           ▼
                                                    ┌─────────────────┐
                                                    │  搜索+跳转原文   │
                                                    └─────────────────┘

使用场景

|------|-------------------|-------------|
| 使用场景 | 描述 | 价值 |
| 产品经理 | 搜索本地产品文档 + 飞书需求文档 | 统一搜索入口,提升效率 |
| 开发者 | 搜索本地代码 + 飞书技术文档 | 快速定位技术资料 |
| 团队协作 | 将飞书团队知识库导出后本地搜索 | 知识沉淀与备份 |


飞书导出工具(配套)

小遥搜索飞书导出工具是独立的 CLI 工具,支持将飞书文档/知识库导出为 Markdown 格式。

工具特性

  • ✅ 支持单个文档导出
  • ✅ 支持知识库文档导出
  • ✅ 支持批量文档导出
  • ✅ 支持文件夹递归导出
  • ✅ 支持完整知识库导出
  • ✅ 自动下载图片和附件
  • ✅ 增量导出(仅导出有更新的文档)
  • ✅ 并发控制(可配置 API 并发数)

安装方式

复制代码
# 全局安装
npm install -g xiaoyaosearch-feishu-export

# 验证安装
feishu-export --version

快速开始

复制代码
# 1. 初始化配置
feishu-export init

# 2. 导出单个文档
feishu-export export -d doxcnXXXXXXXX

# 3. 导出知识库
feishu-export export -w wiki_node_token

# 4. 批量导出
feishu-export docs --file docs.txt

导出格式示例

导出的 Markdown 文件末尾包含元数据:

复制代码
---
> 更新: 2026-03-30 02:52:46
> 来源类型: feishu
> 原文: <https://feishu.cn/wiki/XXXXXXXXXXXXXXXXXXXX>
---

小遥搜索会自动识别这些元数据,并将文档标记为"飞书"数据源。

项目地址https://github.com/dtsola/xiaoyaosearch-feishu-export-md


搜索结果飞书标识

标识样式

  • 图标:云朵图标(CloudOutlined)
  • 颜色:紫色(#722ed1)
  • 文本:显示"飞书"来源标识

搜索结果展示

复制代码
┌────────────────────────────────────────────────────┐
│  🔍 搜索结果                                         │
├────────────────────────────────────────────────────┤
│  📄 产品需求文档_v1.2.md                           │
│     ...摘要内容...                                  │
│     💾 本地文件  │  🕒 2026-03-15                   │
├────────────────────────────────────────────────────┤
│  📄 飞书技术方案.md                                 │
│     ...摘要内容...                                  │
│     🟣 飞书  │  🔗 原文链接  │  🕒 2026-03-20        │
└────────────────────────────────────────────────────┘

原文链接跳转

跳转功能

  • 搜索结果中的飞书文档显示"原文链接"按钮
  • 点击按钮在新标签页打开飞书原文
  • 自动填充文档的完整 URL

适用条件

  • 文档包含飞书元数据
  • 用户有飞书文档访问权限
  • 飞书原文链接有效

📚 技术实现

插件化架构

技术栈

  • Python ABC - 插件接口定义
  • 正则表达式 - 元数据解析
  • importlib - 插件动态加载

插件实现

复制代码
class FeishuDataSource(DataSourcePlugin):
    """飞书数据源插件"""

    def get_file_source_info(self, file_path: str, content: str) -> Dict[str, Any]:
        """从飞书导出的文档中提取元数据"""
        # 1. 检测文件末尾的飞书元数据格式
        # 2. 解析来源类型(feishu)
        # 3. 提取原文链接
        # 4. 返回标准化的数据源信息
        pass

元数据解析流程

复制代码
读取文件内容
     ↓
提取最后 500 字符
     ↓
正则匹配飞书元数据
     ↓
解析原文链接
     ↓
返回 source_type=feishu, source_url=xxx

数据库变更

说明:数据库表结构已在 v1.2.0 插件化架构版本中完成

已有字段

  • source_type TEXT DEFAULT 'filesystem' - 数据源类型(filesystem/yuque/feishu)
  • source_url TEXT - 原文链接

无需修改:本特性直接复用现有字段,无需数据库迁移。


前端支持

说明:前端已在 v1.2.0 插件化架构版本中支持

已有支持

  • 数据源类型映射:feishu: t('searchResult.sourceFeishu')
  • 图标映射:feishu: CloudOutlined
  • 样式定义:.source-type.source-feishu 紫色样式

无需修改:本特性无需前端代码修改。


🔄 升级指南

从 v1.6.0 升级到 v1.7.0

https://www.dtsola.com/archives/a685353b-7e61-4e02-b24c-620f9e65f621


📦 下载地址

  • 小遥搜索 v1.7.0
  • 飞书导出工具

📖 使用示例

场景一:产品经理搜索需求文档

背景:产品经理将需求文档写在飞书中,同时本地有产品设计的 Markdown 文档。

操作步骤

  1. 使用飞书导出工具导出飞书需求文档:

    feishu-export export -w doxcnReqDocId -o D:\docs\feishu

  2. 在小遥搜索中添加扫描路径:D:\docs\feishu

  3. 搜索关键词"用户登录"

  4. 搜索结果同时显示:

    • 本地产品设计文档(来源:本地文件)
    • 飞书需求文档(来源:飞书)
  1. 点击飞书需求文档的"原文链接",跳转到飞书原文查看最新版本

场景二:开发者搜索技术文档

背景:开发团队在飞书中维护技术规范文档,需要与本地代码一起搜索。

操作步骤

  1. 批量导出飞书技术文档:

    创建文档ID列表文件

    echo "doxcnDoc1" > tech-docs.txt
    echo "doxcnDoc2" >> tech-docs.txt

    批量导出

    feishu-export docs --file tech-docs.txt -o D:\docs\tech

  2. 在小遥搜索中添加扫描路径:D:\docs\tech

  3. 搜索技术关键词"API设计"

  4. 快速定位到飞书中的技术规范文档


场景三:知识库定期备份

背景:企业知识库需要定期备份到本地,防止数据丢失。

操作步骤

  1. 设置定时任务(Windows 计划任务):

    每周日凌晨 2 点执行

    feishu-export wiki wiki_token -o D:\backup\feishu --incremental

  2. 小遥搜索自动索引新增/更新的文档

  3. 随时搜索备份的知识库内容


❓ 常见问题

Q1: 如何使用飞书文档搜索?

A: 将飞书文档导出为 Markdown 格式,放到小遥搜索的扫描目录即可,系统会自动识别。

导出方式:

  1. 安装飞书导出工具:npm install -g xiaoyaosearch-feishu-export
  2. 初始化配置:feishu-export init
  3. 导出文档:feishu-export export -d <doc_id> -o <输出目录>

Q2: 飞书导出格式是什么?

A: 飞书导出的 Markdown 文件末尾包含元数据块,标明来源类型和原文链接。

示例格式:

复制代码
---
> 更新: 2026-03-30 02:52:46
> 来源类型: feishu
> 原文: <https://feishu.cn/wiki/MZKMwqpljiod1ak38Cscnr8hnkh>
---

Q3: 可以搜索飞书文档中的图片吗?

A: 目前支持文本搜索,图片搜索需要飞书文档导出时包含图片。

飞书导出工具支持自动下载图片:

复制代码
feishu-export export -d <doc_id> --images

Q4: 飞书原文链接会过期吗?

A: 如果您有飞书文档的访问权限,原文链接可以正常打开。

权限要求:

  • 文档对您可见(公开或您有访问权限)
  • 飞书账号正常登录

Q5: 如何批量导出飞书知识库?

A: 使用飞书导出工具的知识库导出功能:

复制代码
# 导出完整知识库
feishu-export export -w <wiki_id> -o <输出目录>

# 仅生成索引文件(不下载文档)
feishu-export export -w <wiki_id> --index-only

Q6: 搜索不到飞书文档怎么办?

A: 请检查以下几点:

  1. 确认文档已导出到小遥搜索的扫描目录
  2. 确认文档末尾包含飞书元数据
  3. 确认索引已构建完成(查看索引管理页面)
  4. 尝试重新索引该目录

🙏 致谢

感谢以下开源项目的支持:

特别感谢所有贡献者和用户的支持!


让我们一起打造更好的本地搜索体验! 🚀

小遥社区:https://project.xiaoyaosai.com/


📝 版本历史

|--------|------------|------------------------|
| 版本 | 日期 | 主要更新 |
| v1.7.0 | 2026-04-07 | 飞书文档数据源支持 |
| v1.6.0 | 2026-03-26 | 云端嵌入模型支持 + Bug 修复 |
| v1.5.0 | 2026-03-20 | Agent Skills 支持 |
| v1.4.0 | 2026-03-15 | MCP 服务器支持 |
| v1.3.0 | 2026-03-10 | OpenAI 云端模型支持 + Bug 修复 |
| v1.2.0 | 2026-03-05 | 插件化架构 + 语雀数据源 |
| v1.1.0 | 2026-02-28 | i18n 国际化支持 |
| v1.0.0 | 2026-02-20 | MVP 版本发布 |


#独立开发者 #知识工作者 #知识库 #AI工具 #内容创作者 #一人公司 #ai搜索 #dify #ragflow #vibecoding

相关推荐
大橙子打游戏17 小时前
用 Claude Code 的人,都需要的“对话归档箱”
vibecoding
mask哥19 小时前
codex安装并配置第三方大模型api方法详解
人工智能·ai编程·codex·vibecoding
海市公约20 小时前
从 CRUD 到 AI 工程:基于 FastAPI + Dify 的 AI 面试模拟系统实践
prompt·fastapi·项目实战·dify·ai工作流·后端架构
浪里行舟1 天前
你的品牌正在被AI“遗忘”?用BuildSOM找回搜索的下一个风口
人工智能·python·程序员
程序员cxuan1 天前
当 00 后开始用 token 给学校送礼
人工智能·后端·程序员
诸神缄默不语1 天前
营销体系4M模型:MVP(最小可行性产品)、PMF(产品市场匹配)、GTM(市场进入)和MTU(市场转化)
程序员
Hilaku1 天前
从搜索排名到 AI 回答? 先聊一聊 AI 可见度工具 BuildSOM !
前端·javascript·程序员
用户398181661741 天前
Claude Code LSP 在 Windows 上的配置与排坑
vibecoding
文心快码BaiduComate2 天前
用Comate 7天完成”鹅鸭杀”游戏网站开发
前端·后端·程序员
o_insist2 天前
everything-claude-code 在 Codex 的应用:不要照搬全家桶,而是做一套更聪明的增强层
人工智能·ai编程·vibecoding