小白也能用AI开发「小红书自动归档多维表格」采集神器,躺平整理笔记真香

大家好我是阿星👏🏻!

你平常有没有看到好选题,想带链接保存下来的时候呢?又不太方便直接整理到excel里🤔

现在,我们将通过AI coding的方式,构建chrome插件。一键采集心仪小红书笔记并瞬间传送到飞书文档的~效果👇

不用做任何下载,填写地址、飞书appid

轻轻在浏览器里点击采集即可~

所有标题、正文、点赞数、评论数、标签都被存到多维表格里啦~

核心结构如下:

创建多维表格应用

首先打开API文档。

小白不用纠结什么是api,就是钥匙🔑。代码这东西太精密了,要让外界精密地和飞书多维表格对接就得有🔑。

API文档有很多很多,你要用到的只是飞书多维表格API里的新增记录这一项,文档地址传送门:

open.feishu.cn/document/se...

另外给多维表格添加应用。

为什么要添加?

光有钥匙🔑还不行,代码很挑剔不是谁都接待,往往是封装好的才能对接。相当于火箭先在工地上装个发射台,才能上天,这个应用你就当是接驳的,送你的代码上天用的发射台。

先去右上角创建一个应用。

然后在你刚才创建的应用里👉🏻新增记录👉🏻调试台

拿到app token和app secret。

先保存下来。

初步查看API文档

要测试就要有API------至于为什么要测试,因为API这个东西你最后几步编程也要看能否跑通,到时候用cursor测试还是浪费你钱,现在飞书上试试,能跑通的话,到时候直接复制粘贴直接让cursor写。

现在咱们只主打一个知道API那一坨代码在哪里就可以了,不用每一句都看懂。

AI能看懂就行了,AI就是咱们实习生,不会再问就行了。

先随便看看👇🏻

你可以从API文档里发现,最关键的就是这几行,也就是fields字段:比如可以提炼为下面的格式,相当于火箭的body身体。我们最后测试用的也是这几行。

先填到测试台的请求体,也就是body里

json 复制代码
{
  "fields": {
    "url": "<页面的URL>",
    "标题": "<提取的标题title文本>",
    "作者": "<提取的作者username文本>",
    "正文": "<提取的正文note-text文本>",
    "标签": ["提取的标签tag", "文本"],
    "点赞": 19,
    "收藏": 21,
    "评论": 23
  }
}

创建多维表格

与此同时,在飞书多维表格里创建一个表头一样的飞书多维表格。

注意tableid是table后面这串字符👇🏻,

先复制保存下来。

然后要开通改一下新增记录权限,并发布!不发布相当于暗恋不表白,没用。

点击发布,一个完整的服务就被你发布了,多么复杂的科技就被这简单的可视化界面搞定了🤔。

给多维表格连上应用

然后回去打开多维表格,多维表格里也要连上我们创建的飞书应用,才能工作。

如果你前面忘了做上线那一步,

你会发现搜不到自己刚创建的应用,尴尬了😂

回到工作台。左下角点版本管理与发布,上线新版本就行了。

回到刚才多维表格里添加应用的地方,重新添加一次即可。

测试API

接着,我们回到控API调试控制台,继续填写测试参数,

你会发现调试台上还让填一个apptoken,千万别填成文章开头创建的应用的apptoken,跟着下面这个图,把你创建的多维表格的地址栏里base后面的一串填进去就可以了👇🏻

另外一个appid直接复制控制台的。

类型选tenant,不要选user!!!!!!!

参数过期就点下获取token就可以了

测试~

可以发现,内容已经成功写入了。

这说明我们上面测试过的,这段请求体是正确的,之后可以放心发给AI:

json 复制代码
{
  "fields": {
    "url": "<页面的URL>",
    "标题": "<提取的标题title文本>",
    "作者": "<提取的作者username文本>",
    "正文": "<提取的正文note-text文本>",
    "标签": ["提取的标签tag", "文本"],
    "点赞": 19,
    "收藏": 21,
    "评论": 23
  }
}

这段能跑通的API,先放在这里。

梳理小红书页面元素

解决了如何通信,我们要解决通信什么的问题。

到底爬小红书的啥啊?

我们来解决捕获标题、作者、正文元素的问题,根据F12翻出的元素找到对应值。

你会发现最后就集中在note和text相关的块块里有笔记内容,在data-clas-count里也有相关数据。

其实你也可以让AI给你找,前提是自己有数,不然很容易被忽悠......

最后总结下来对应关系是👇🏻

提示词的6个组成部分

接着我们撰写提示词👇一共分为6个部分,

你的总提示词必须有下面这些内容,自己整理成一个大提示词发给cursor就行了👇

1、项目概述

sql 复制代码
插件基础信息

名称:Redbook Collect

功能定位:网页信息提取+飞书多维表格写入

运行环境:Chrome浏览器

2、核心功能流程

css 复制代码
graph TD
A[用户点击插件] --> B{配置检测}
B -->|未配置| C[弹出配置窗口]
B -->|已配置| D{页面检测}
D -->|非小红书笔记页| E[显示提示]
D -->|有效笔记页| F[执行数据提取]
F --> G[构建JSON数据结构]
G --> H[调用飞书API写入]

3、配置参数和独立标签页

告诉AI,用户需要输入的必要参数:

表格URL(含app_token和table_id)

app_token

app_secret

以及,用户和插件之间的交互方式:独立标签页配置(配置项较多(如飞书的 app_token、table_id、app_secret 等),弹窗(Popup)空间有限,独立标签页提供更大的布局空间。)

4、html上的数据提取范例

告诉AI它分别需要抓取的是小红书页面上的哪些元素。

5、交互逻辑设计

告诉AI整个的工作原理是什么,就是代码的蹦迪路线是什么。

kotlin 复制代码
认证流程:

用app_token/app_secret获取tenant_access_token
携带token进行数据写入



URL参数解析逻辑:
原始URL → 提取app_token → 提取table_id


请求体结构:
{
"fields": {
    "url": "String",
    "标题": "String",
    "作者": "String",
    "正文": "String",
    "标签": ["String"],
    "点赞": Int,
    "收藏": Int,
    "评论": Int
  }
}

6、其他辅助

告诉AI其他可能遇到的情况:

异常处理:

  • 配置缺失提醒(用户没有填好密钥还怪你软件不行)
  • 非目标页面提醒(用户打开baidu让你采集小红书)
  • 认证令牌刷新机制(隐含)

开发辅助

  • 完整API请求示例
  • 关键变量提取示例(关键变量就是你得先填好的飞书账号密码和表格地址,加上要从小红书页面上抠下来的标题、作者、点赞这些具体内容)
  • 提供小红书某一个页面的HTML结构参考也就是👇小红书中要被提取信息的html中,所有的F12出来的html全都发给大模型,作为附件(可选,我亲测没有这个附件也还行)。

现在恭喜你终于可以开始编程了。同时提醒大家,稍微复杂点的AI编程都是这样提前设计很长的提示词的,不是和AI聊天聊出来的。

用cursor辅助编程

首先在本地随便创建一个英文的 文件夹,然后在cursor里打开这个文件夹👇总结上面的6项为一个提示词发过去之后很快项目就出来了

它还给出了整个Readme文档。(说明文档)

在Chrome测试插件

我们放到浏览器里试试。

打开开发者模式,加载已解压的扩展程序

然后就可以载入使用啦~

系统可能会提醒你找不到icon。其实只用在你的项目根目录下创建3张照片如下命名即可:

记得在右上角pin一下!

点击插件图标,配置appid那些参数

注意,插件里第一行就是appid (注意不是tenant!!!) ,第二行就是appscrect,就是控制台里的这一对👇🏻

加上飞书多维表格地址就行了👇🏻

随便找个文章试试,哇哦很快就可以采集上~

采集成功即为绿色👇

你会发现多维表格里神奇了多了几行~

但是你会看到有的字段没有采集到信息🤔!!!

别捉急,可以让AI严格按照下图对应关系再采集一遍:

和AI重申之后你就会发现,它又行了!每个字段都给你咔咔爬下来了👍

是不是很方便哦~特别是对标签的收纳,让我们一眼就知道自己关注的话题集中在哪个领域

往期文章:

相关推荐
Acrelgq234 分钟前
政策支持与市场驱动:充电桩可持续发展的双轮引擎
人工智能
软件测试小仙女9 分钟前
AI测试工具Testim——告别自动化测试维护难题
自动化测试·软件测试·人工智能·测试工具·单元测试·集成测试·压力测试
xieyan081132 分钟前
MCP之一_MCP协议解析
人工智能
小华同学ai37 分钟前
2.1k star! 抓紧冲,DeepChat:连接AI与个人世界的智能助手的开源项目
人工智能·ai·开源·github·工具
界面开发小八哥1 小时前
智能Python开发工具PyCharm v2025.1——AI层级功能重磅升级
ide·人工智能·python·pycharm·开发工具
汀丶人工智能1 小时前
Qwen3强势来袭:推理力爆表、语言超百种、智能体协作领先,引领AI开源大模型
人工智能
Blossom.1181 小时前
可解释人工智能(XAI):让机器决策透明化
人工智能·驱动开发·深度学习·目标检测·机器学习·aigc·硬件架构
极客智谷1 小时前
Spring AI应用系列——基于Alibaba DashScope的聊天记忆功能实现
人工智能·后端
极客智谷1 小时前
Spring AI应用系列——基于Alibaba DashScope实现功能调用的聊天应用
人工智能·后端
-一杯为品-1 小时前
【深度学习】#10 注意力机制
人工智能·深度学习