小遥搜索v1.7.0版本更新【飞书文档+知识库支持】

版本预览


v1.7.0 版本更新说明

发布日期 :2026年04月07日
版本类型 :重大功能更新
主题:飞书文档+知识库支持


📋 版本概述

小遥搜索 v1.7.0 正式支持 飞书文档数据源 ,配合小遥搜索飞书导出工具(https://github.com/dtsola/xiaoyaosearch-feishu-export-md),让您能够搜索从飞书导出的本地 Markdown 文档,在搜索结果中清晰标识飞书文档来源,并支持一键跳转到飞书原文。

核心亮点

  • 📄 飞书文档识别:自动识别从飞书导出的 Markdown 文档
  • 🔗 原文链接跳转:搜索结果支持直接跳转到飞书原文
  • 🎨 飞书标识展示:搜索结果中使用紫色"飞书"标识区分数据来源
  • 🔌 插件化架构:基于插件化框架,扩展数据源更灵活
  • 🛠️ 配套导出工具:独立的飞书导出 CLI 工具,支持批量导出

✨ 新增功能

飞书文档数据源支持

功能定位

为小遥搜索添加飞书文档数据源识别能力,让用户能够搜索从飞书导出的本地 Markdown 文档。

使用流程

复制代码
┌─────────────────┐      ┌──────────────────┐      ┌─────────────────┐
│  飞书文档/知识库  │ ───▶ │  飞书导出工具      │ ───▶ │  本地MD文件      │
└─────────────────┘      └──────────────────┘      └─────────────────┘
                                                           │
                                                           ▼
                                                    ┌─────────────────┐
                                                    │  小遥搜索        │
                                                    │  自动识别        │
                                                    └─────────────────┘
                                                           │
                                                           ▼
                                                    ┌─────────────────┐
                                                    │  搜索+跳转原文   │
                                                    └─────────────────┘

使用场景

|------|-------------------|-------------|
| 使用场景 | 描述 | 价值 |
| 产品经理 | 搜索本地产品文档 + 飞书需求文档 | 统一搜索入口,提升效率 |
| 开发者 | 搜索本地代码 + 飞书技术文档 | 快速定位技术资料 |
| 团队协作 | 将飞书团队知识库导出后本地搜索 | 知识沉淀与备份 |


飞书导出工具(配套)

小遥搜索飞书导出工具是独立的 CLI 工具,支持将飞书文档/知识库导出为 Markdown 格式。

工具特性

  • ✅ 支持单个文档导出
  • ✅ 支持知识库文档导出
  • ✅ 支持批量文档导出
  • ✅ 支持文件夹递归导出
  • ✅ 支持完整知识库导出
  • ✅ 自动下载图片和附件
  • ✅ 增量导出(仅导出有更新的文档)
  • ✅ 并发控制(可配置 API 并发数)

安装方式

复制代码
# 全局安装
npm install -g xiaoyaosearch-feishu-export

# 验证安装
feishu-export --version

快速开始

复制代码
# 1. 初始化配置
feishu-export init

# 2. 导出单个文档
feishu-export export -d doxcnXXXXXXXX

# 3. 导出知识库
feishu-export export -w wiki_node_token

# 4. 批量导出
feishu-export docs --file docs.txt

导出格式示例

导出的 Markdown 文件末尾包含元数据:

复制代码
---
> 更新: 2026-03-30 02:52:46
> 来源类型: feishu
> 原文: <https://feishu.cn/wiki/XXXXXXXXXXXXXXXXXXXX>
---

小遥搜索会自动识别这些元数据,并将文档标记为"飞书"数据源。

项目地址https://github.com/dtsola/xiaoyaosearch-feishu-export-md


搜索结果飞书标识

标识样式

  • 图标:云朵图标(CloudOutlined)
  • 颜色:紫色(#722ed1)
  • 文本:显示"飞书"来源标识

搜索结果展示

复制代码
┌────────────────────────────────────────────────────┐
│  🔍 搜索结果                                         │
├────────────────────────────────────────────────────┤
│  📄 产品需求文档_v1.2.md                           │
│     ...摘要内容...                                  │
│     💾 本地文件  │  🕒 2026-03-15                   │
├────────────────────────────────────────────────────┤
│  📄 飞书技术方案.md                                 │
│     ...摘要内容...                                  │
│     🟣 飞书  │  🔗 原文链接  │  🕒 2026-03-20        │
└────────────────────────────────────────────────────┘

原文链接跳转

跳转功能

  • 搜索结果中的飞书文档显示"原文链接"按钮
  • 点击按钮在新标签页打开飞书原文
  • 自动填充文档的完整 URL

适用条件

  • 文档包含飞书元数据
  • 用户有飞书文档访问权限
  • 飞书原文链接有效

📚 技术实现

插件化架构

技术栈

  • Python ABC - 插件接口定义
  • 正则表达式 - 元数据解析
  • importlib - 插件动态加载

插件实现

复制代码
class FeishuDataSource(DataSourcePlugin):
    """飞书数据源插件"""

    def get_file_source_info(self, file_path: str, content: str) -> Dict[str, Any]:
        """从飞书导出的文档中提取元数据"""
        # 1. 检测文件末尾的飞书元数据格式
        # 2. 解析来源类型(feishu)
        # 3. 提取原文链接
        # 4. 返回标准化的数据源信息
        pass

元数据解析流程

复制代码
读取文件内容
     ↓
提取最后 500 字符
     ↓
正则匹配飞书元数据
     ↓
解析原文链接
     ↓
返回 source_type=feishu, source_url=xxx

数据库变更

说明:数据库表结构已在 v1.2.0 插件化架构版本中完成

已有字段

  • source_type TEXT DEFAULT 'filesystem' - 数据源类型(filesystem/yuque/feishu)
  • source_url TEXT - 原文链接

无需修改:本特性直接复用现有字段,无需数据库迁移。


前端支持

说明:前端已在 v1.2.0 插件化架构版本中支持

已有支持

  • 数据源类型映射:feishu: t('searchResult.sourceFeishu')
  • 图标映射:feishu: CloudOutlined
  • 样式定义:.source-type.source-feishu 紫色样式

无需修改:本特性无需前端代码修改。


🔄 升级指南

从 v1.6.0 升级到 v1.7.0

https://www.dtsola.com/archives/a685353b-7e61-4e02-b24c-620f9e65f621


📦 下载地址

  • 小遥搜索 v1.7.0
  • 飞书导出工具

📖 使用示例

场景一:产品经理搜索需求文档

背景:产品经理将需求文档写在飞书中,同时本地有产品设计的 Markdown 文档。

操作步骤

  1. 使用飞书导出工具导出飞书需求文档:

    feishu-export export -w doxcnReqDocId -o D:\docs\feishu

  2. 在小遥搜索中添加扫描路径:D:\docs\feishu

  3. 搜索关键词"用户登录"

  4. 搜索结果同时显示:

    • 本地产品设计文档(来源:本地文件)
    • 飞书需求文档(来源:飞书)
  1. 点击飞书需求文档的"原文链接",跳转到飞书原文查看最新版本

场景二:开发者搜索技术文档

背景:开发团队在飞书中维护技术规范文档,需要与本地代码一起搜索。

操作步骤

  1. 批量导出飞书技术文档:

    创建文档ID列表文件

    echo "doxcnDoc1" > tech-docs.txt
    echo "doxcnDoc2" >> tech-docs.txt

    批量导出

    feishu-export docs --file tech-docs.txt -o D:\docs\tech

  2. 在小遥搜索中添加扫描路径:D:\docs\tech

  3. 搜索技术关键词"API设计"

  4. 快速定位到飞书中的技术规范文档


场景三:知识库定期备份

背景:企业知识库需要定期备份到本地,防止数据丢失。

操作步骤

  1. 设置定时任务(Windows 计划任务):

    每周日凌晨 2 点执行

    feishu-export wiki wiki_token -o D:\backup\feishu --incremental

  2. 小遥搜索自动索引新增/更新的文档

  3. 随时搜索备份的知识库内容


❓ 常见问题

Q1: 如何使用飞书文档搜索?

A: 将飞书文档导出为 Markdown 格式,放到小遥搜索的扫描目录即可,系统会自动识别。

导出方式:

  1. 安装飞书导出工具:npm install -g xiaoyaosearch-feishu-export
  2. 初始化配置:feishu-export init
  3. 导出文档:feishu-export export -d <doc_id> -o <输出目录>

Q2: 飞书导出格式是什么?

A: 飞书导出的 Markdown 文件末尾包含元数据块,标明来源类型和原文链接。

示例格式:

复制代码
---
> 更新: 2026-03-30 02:52:46
> 来源类型: feishu
> 原文: <https://feishu.cn/wiki/MZKMwqpljiod1ak38Cscnr8hnkh>
---

Q3: 可以搜索飞书文档中的图片吗?

A: 目前支持文本搜索,图片搜索需要飞书文档导出时包含图片。

飞书导出工具支持自动下载图片:

复制代码
feishu-export export -d <doc_id> --images

Q4: 飞书原文链接会过期吗?

A: 如果您有飞书文档的访问权限,原文链接可以正常打开。

权限要求:

  • 文档对您可见(公开或您有访问权限)
  • 飞书账号正常登录

Q5: 如何批量导出飞书知识库?

A: 使用飞书导出工具的知识库导出功能:

复制代码
# 导出完整知识库
feishu-export export -w <wiki_id> -o <输出目录>

# 仅生成索引文件(不下载文档)
feishu-export export -w <wiki_id> --index-only

Q6: 搜索不到飞书文档怎么办?

A: 请检查以下几点:

  1. 确认文档已导出到小遥搜索的扫描目录
  2. 确认文档末尾包含飞书元数据
  3. 确认索引已构建完成(查看索引管理页面)
  4. 尝试重新索引该目录

🙏 致谢

感谢以下开源项目的支持:

特别感谢所有贡献者和用户的支持!


让我们一起打造更好的本地搜索体验! 🚀

小遥社区:https://project.xiaoyaosai.com/


📝 版本历史

|--------|------------|------------------------|
| 版本 | 日期 | 主要更新 |
| v1.7.0 | 2026-04-07 | 飞书文档数据源支持 |
| v1.6.0 | 2026-03-26 | 云端嵌入模型支持 + Bug 修复 |
| v1.5.0 | 2026-03-20 | Agent Skills 支持 |
| v1.4.0 | 2026-03-15 | MCP 服务器支持 |
| v1.3.0 | 2026-03-10 | OpenAI 云端模型支持 + Bug 修复 |
| v1.2.0 | 2026-03-05 | 插件化架构 + 语雀数据源 |
| v1.1.0 | 2026-02-28 | i18n 国际化支持 |
| v1.0.0 | 2026-02-20 | MVP 版本发布 |


#独立开发者 #知识工作者 #知识库 #AI工具 #内容创作者 #一人公司 #ai搜索 #dify #ragflow #vibecoding

相关推荐
程序员鱼皮7 小时前
DeepSeek V4 + GPT-5.5 一手实战,结果很意外!附 Codex 保姆级项目教程
ai·程序员·编程·ai编程·deepseek
Hilaku7 小时前
OpenClaw 为什么突然不火了?
前端·javascript·程序员
想拿大厂offer9 小时前
【MarkDown】MarkDown 常用语法
飞书
两万五千个小时12 小时前
Agent 任务没做完就停了?我扒了 Claude Code 源码,找到了 4 层原因
人工智能·程序员·架构
TG_yunshuguoji12 小时前
云代理商:DeepSeek V4 重塑云服务 AI 格局 推理成本直降
人工智能·云计算·ai智能体·deepseek v4
夜魔00913 小时前
Dify插件 Markdown Exporter 3.6.9离线安装包制作
markdown·exporter·dify·离线安装·dify 1.13.3·3.6.9·内网安装
CodeSheep13 小时前
DeepSeek的最新招人标准,太讽刺了。
前端·后端·程序员
comcoo13 小时前
飞书联动 OpenClaw 配置方法,办公效率拉满
飞书·open claw部署
产业家13 小时前
项目管理AI第一枪,为什么是飞书项目?
人工智能·飞书
SimonKing14 小时前
frontend-dev vs ui-ux-pro-max:谁才是Vibe Coding前端开发的“最强辅助”?
java·后端·程序员