⁣⁢⁤⁤⁡‬‌⁣‌‍⁣⁡‍‍‬‍‍‬‍‍⁤⁤⁢⁣⁢⁢⁢‬⁢‍⁡‍‌⁤‌⁢⁣升级!Coze 工作流实现小红书、公众号及通用网页内容采集,自动归档飞书多维表格

上一篇文章,我们做一个《小红书笔记采集,自动归档飞书文档》的coze工作流,解决了小红书内容批量采集与整理的难题。这次,我们再原来的基础上再次扩展,增加公众号文章采集、以及任意网站通用采集功能,覆盖更多场景,实现"一流程搞定多平台内容归档",大幅提升信息整理效率。

一、效果演示:

在工作流中输入:飞书文档链接 + 网站地址。

这里我输入了一个公众号的文章,内容就会被自动采集并到飞书文档。

二、主流程

整体流程可分为 9 个核心节点,按执行顺序依次为:

开始节点→判断链接类型→选择器节点→文章采集→笔记格式化→变量聚合→记录保存到多维表格→判断是否上传成功→结束节点。

"文章采集" 环节通过分支设计,实现不同平台内容的差异化采集。

coze工作流节点:

下面开始手把手教学

三、手把手搭建:从飞书表格准备到工作流配置

飞书多维表格用来储存coze工作流采集的文章内容。需要先创建表格,后续 Coze 工作流会将采集到的内容自动填入对应字段。

  1. 复制表格模板:直接使用 "模版"(模板已适配小红书、公众号、通用网页的所有采集字段),无需手动创建字段,复制后即可使用

  2. 获取表格链接(关键!):复制模板后,用网页端打开飞书多维表格,然后复制浏览器地址栏中的完整链接------ 注意链接必须包含tableview两个参数(例如:https://feishu.cn/base/xxx?table=tblxxxx&view=vewxxxx),后续配置 "保存节点" 时需用到该链接,缺少参数会导致数据无法写入。

模板在这:柒崽-网页内容采集模版

找不到复制按钮的看这里:

复制号表格之后,用网页打开,然后复制多维表格的地址,注意一定要带table和view这两个参数。这个地址后面要用到。

第一步、开始节点

这个没啥变化

  • feishu_url: 飞书表格的地址

  • web_url: 需要采集的文章链接

第二步、判断链接类型

根据链接类型,判断是公众号、小红书,等。

代码:

javascript 复制代码
async function main({ params }: Args): Promise<Output> {
    const url = params.url;
    let res: string = '';
    if (url.includes('xiaohongshu.com')) {
        res = '小红书'
    } else if(url.includes('https://mp.weixin.qq.com/')){
        res = "公众号"
    }  else {
        res = '未知'
    }
    // 构建输出对象
    const ret = {
        "url_type_name": res, // 拼接两次入参 input 的值
    };

    return ret;
}

第三步、选择器节点

根据不同的类型,执行不同的文章采集流程。

第四步、文章采集

文章采集的3个节点,都是社区提供的插件,直接使用就可以了。

第五步、笔记格式化

这个节点用代码才方便处理,三个流程都大同小异,就是将采集的内容,转成飞书多维表格的字段。

放一个小红书的案例代码,大家举一反三。

javascript 复制代码
async function main({ params }: Args): Promise<Output> {
    // 构建输出对象
    const ret = {
        "records": [{"fields":{
            "标题": params.xiaohongshu.title,
            "内容": params.xiaohongshu.content,
            "平台": params.url_type_name,
            "内容图": params.xiaohongshu.image_urls.join('/n'),
            "原文链接": params.origin_url,
        }}],
    };

    return ret;
}

第六步、变量聚合

将上面3个流程的内容,一起处理,这个节点会取第一个有值的数据。也就是前面3个流程,运行哪个,这个节点就取哪个节点的值。

第七步、记录保存到多维表格

将内容保存到飞书。这个节点运行完成,内容就会保存完成。

第八步、判断是否上传成功

这个我们根据上传的结果,返回不同的提示。

javascript 复制代码
async function main({ params }: Args): Promise<Output> {
    let res = '';
    // 构建输出对象
    if (params.add_feishu_res.code === 0) {
        res = `添加到飞书成功:[点击查看](${params.feishu_url})`
    } else {
        res = `添加到飞书失败,错误信息:${params.add_feishu_res.msg}`
    }
    return { res }
}

第九步、结束节点

这样一个自动采集的工作流就做好了。


完整的工作流配置文件下载,放在了下面这个文章中。

mp.weixin.qq.com/s/xwVRe2_Iw...

相关推荐
lypzcgf14 小时前
Coze源码分析-资源库-编辑知识库-后端源码-流程/技术/总结
系统架构·知识库·coze·coze源码分析·智能体平台·ai应用平台·agent平台
lypzcgf14 小时前
Coze源码分析-资源库-编辑数据库-后端源码-数据存储层
数据库·coze·coze源码分析·智能体平台·ai应用平台
lypzcgf2 天前
Coze源码分析-资源库-编辑工作流-后端源码-数据存储/安全/错误
安全·工作流·错误处理·coze·coze源码分析·智能体平台·agent平台
lypzcgf2 天前
Coze源码分析-资源库-编辑知识库-后端源码-基础设施/存储层
系统架构·go·知识库·coze·coze源码分析·智能体平台·ai应用平台
lypzcgf4 天前
Coze源码分析-资源库-编辑工作流-后端源码-IDL/API/应用服务层
coze·coze源码分析·智能体平台·ai应用平台
lypzcgf5 天前
Coze源码分析-资源库-编辑知识库-前端源码-核心组件
前端·知识库·coze·coze源码分析·智能体平台·ai应用平台·agent平台
lypzcgf5 天前
Coze源码分析-资源库-编辑工作流-后端源码-流程/技术/总结
go·源码分析·工作流·coze·coze源码分析·ai应用平台·agent平台
lypzcgf5 天前
Coze源码分析-资源库-编辑工作流-前端源码-核心流程/API/总结
前端·工作流·coze·coze源码分析·智能体平台·ai应用平台·agent平台
lypzcgf5 天前
Coze源码分析-资源库-编辑工作流-前端源码-核心组件
前端·工作流·coze·coze源码分析·智能体平台·agent平台
lypzcgf6 天前
Coze源码分析-资源库-编辑插件-后端源码-领域/数据访问层
系统架构·插件·coze·coze源码分析·智能体平台·ai应用平台·agent平台