飞书文档定时自动同步至百炼知识库

场景痛点与解决方案

在如今AI时代,将知识库同步到Agent平台做RAG已经屡见不鲜。然而,企业往往都面临着数据同步困难,手动同步耗时耗力,跨平台操作困难且有安全风险,常常更新不及时等问题。

现在,阿里云AppFlow提供了飞书文档定时自动同步功能,能够完全自动化将您的飞书文档同步到百炼知识库中,助力企业实现知识资产的高效流转。本文将深度介绍同步方案。

配置步骤指南

创建飞书应用机器人

  1. 登录飞书开发者后台
  2. 在开发者后台首页,单击 创建企业自建应用,填写应用名称、描述以及图标信息,然后单击 创建。
  1. 开发配置 > 权限管理 页面,为应用添加以下 API 权限。
    • docx:document:readonly :查看新版文档

配置AppFlow连接流

步骤一:配置定时重复触发器

  1. 访问AppFlow控制台,创建连接流。
  2. 触发事件选择定时调度------重复调度事件,填写cron表达式。可以使用生成工具生成,并查看后5次执行时间来验证自己的cron表达式是否正确。例如每天早上6点执行:0 0 6 ? * *

步骤二:获取飞书文档

  1. 在全部连接器中选择飞书应用 -获取云文档文本 ,点击下一步。
  2. 点击添加连接凭证,填写自己可辨识的凭证名称。
    1. 前往飞书开放平台-选择您创建的自建应用
    2. 选择凭证与基础信息-查看App ID和App Secret
    3. 点击确定创建并选择该鉴权凭证
  3. 复制并填写您飞书文档ID,获取方式如下图所示:
  4. 为防止出现无权限访问的情况,可以添加文档应用到文档中(组织内公开的文档无需此步骤)

步骤三:上传至百炼应用数据

  1. 在全部连接器中选择百炼RAG知识检索 -临时文件导入至百炼应用数据
  2. 新建凭证,按照指引选择已有RAM角色或新建RAM角色,AppFlow将使用您的RAM角色访问百炼知识库
  3. 填写业务空间ID。在百炼控制台点击您的业务空间 -业务空间详情
  4. 类目类型选择结构化数据
  5. 填写类目ID,AppFlow会将您的飞书文档上传到指定的应用数据类目
  6. 文档名称可以引用飞书的返回值"文档标题 ",下载码应用飞书的返回值"下载码"

步骤四:导入百炼知识库

  1. 在全部连接器中选择百炼RAG知识检索 -将应用数据导入知识库索引
  2. 选择上一步的连接凭证即可
  3. 填写您的业务空间ID
  4. 填写知识库ID
  5. 应用数据文件ID选择上一步上传获得的文件ID
  1. 点击保存发布连接流,您的定时任务将会在指定时间被触发。

步骤五:新增百炼用户

  1. 在百炼点击权限管理 - 新增用户 ,选择RAM角色
  2. 下拉选择在AppFlow创建鉴权凭证时选择或新建的角色名称,点击确定

手动触发同步

在AppFlow连接流列表,找到您的连接流,点击运行一次即可手动完成一次文档同步

导入模版------更简单的配置方式

您可以在AppFlow页面找到导入模版,下载模版链接里的模版文件导入后进行配置,可以省去部分操作步骤。

相关推荐
谷咕咕5 小时前
windows下python3,LLaMA-Factory部署以及微调大模型,ollama运行对话,开放api,java,springboot项目调用
java·windows·语言模型·llama
扫地的小何尚7 小时前
深度解析 CUDA-QX 0.4 加速 QEC 与求解器库
人工智能·语言模型·llm·gpu·量子计算·nvidia·cuda
charieli-fh8 小时前
指令微调数据评估与影响:构建高质量大语言模型的关键
人工智能·深度学习·语言模型
eqwaak09 小时前
Python Pillow库详解:图像处理的瑞士军刀
开发语言·图像处理·python·语言模型·pillow
HenrySmale18 小时前
论文笔记:How Can Recommender Systems Benefit from Large Language Models: A Survey
人工智能·语言模型·chatgpt
闲看云起19 小时前
大语言模型(LLM)入门全解
人工智能·语言模型·自然语言处理
DuHz19 小时前
Phi-3 技术报告:手机本地运行的高能力语言模型——论文阅读
论文阅读·人工智能·语言模型·自然语言处理·智能手机
小苑同学21 小时前
PaperReading:《Manipulating Multimodal Agents via Cross-Modal Prompt Injection》
人工智能·网络安全·语言模型·prompt·安全性测试
STLearner1 天前
AI论文速读 | 当大语言模型遇上时间序列:大语言模型能否执行多步时间序列推理与推断
大数据·论文阅读·人工智能·深度学习·机器学习·语言模型·自然语言处理
小小测试开发1 天前
用Python打造离线语音控制浏览器:基于VOSK的实用案例
python·语言模型·webbrowser·vosk·pyaudio