用 n8n + GitHub API 搭建 AI 开源项目自动监控系统(Docker 部署 + 评分模型 + Lark推送)

背景

研究 GitHub 上 AI 自动化方向的开源项目(n8n、Dify、Flowise 这些),需要一个自动化的选题监控工具。手动刷 Trending 效率太低,而且 Trending 算法不一定能覆盖我关注的细分方向。

目标:每天定时搜索 GitHub 上 AI/Agent/工作流相关的高星项目,用自定义评分模型排序,推送 Top 5 到Lark群。

技术栈:n8n(Docker 自托管)+ GitHub REST API v3 + Lark Webhook。

最终效果

n8n 工作流 5 个节点:

scss 复制代码
Schedule Trigger → HTTP Request(GitHub API) → Code(评分) → Code(格式化) → HTTP Request(Lark)

每天 08:00 自动执行,Lark群收到格式化的 Top 5 项目列表。

GitHub API 踩坑

坑1:OR 操作符上限

GitHub Search API 限制单次查询最多 5 个逻辑操作符。超过直接返回 422:

json

json 复制代码
{"message":"Validation Failed","errors":[{"message":"More than five AND / OR / NOT operators were used."}]}

坑2:qualifier 不支持 OR

topic:ai-agent OR topic:automation 这种写法无效。topic: 是 qualifier,OR 只能连接 search term。

最终可用的 query:

复制代码
ai agent workflow automation stars:>1000 pushed:>2026-03-01

纯文本关键词(GitHub 做全文匹配)+ starspushed 两个 qualifier 过滤。

评分模型实现

在 n8n 的 Code 节点里用 JavaScript 实现。核心逻辑:

javascript

ini 复制代码
// 关键词库
const hotWords = [
  'agent','n8n','workflow','automation','llm','ai',
  'dify','langchain','flowise','mcp','claude',
  'deepseek','chatbot','rag','typebot','chatwoot',
  'self-hosted','no-code','low-code'
];

// 对每个 repo 评分
const all = `${desc} ${name} ${topics}`;
const hits = hotWords.filter(w => all.includes(w));

let score = 0;

// Star 总量 (0-25)
if (repo.stargazers_count > 50000) score += 25;
else if (repo.stargazers_count > 10000) score += 20;
else if (repo.stargazers_count > 3000) score += 15;
else score += 8;

// 关键词匹配 (0-30)
score += Math.min(hits.length * 6, 30);

// 更新活跃度 (0-20)
const days = Math.floor(
  (Date.now() - new Date(repo.pushed_at).getTime()) / 86400000
);
if (days <= 3) score += 20;
else if (days <= 14) score += 12;
else score += 5;

// 描述质量 (0-10)
if (repo.description && repo.description.length > 20) score += 10;

// 语言友好度 (0-15)
const easy = ['python','javascript','typescript','shell'];
if (easy.includes((repo.language || '').toLowerCase())) score += 15;
else score += 5;

满分 100,按分数降序取前 5。

Lark消息格式化

javascript

javascript 复制代码
const medals = ['🥇','🥈','🥉','4️⃣','5️⃣'];
items.forEach((item, i) => {
  const r = item.json;
  const s = r.stars >= 1000 
    ? (r.stars/1000).toFixed(1)+'k' : r.stars;
  msg += `${medals[i]} ${r.name}\n`;
  msg += `   ⭐${s} · ${r.lang} · 评分${r.score}\n`;
  msg += `   ${r.desc}\n`;
  msg += `   🔗 ${r.url}\n`;
  msg += `   🎯 ${r.keywords}\n\n`;
});

通过Lark自定义机器人 Webhook POST 发送,msg_type: "text"

部署

bash

bash 复制代码
# 一行命令部署 n8n
docker run -d --name n8n -p 5678:5678 \
  -v n8n_data:/home/node/.n8n \
  --restart always n8nio/n8n

导入工作流 JSON → 配置Lark Webhook URL → Publish 激活。

可优化方向

  1. 加 GitHub Token 认证:未认证的 API 限制 10 次/分钟,加 Token 后提升到 30 次/分钟
  2. 多次搜索合并:用不同关键词组合做 2-3 次搜索,合并去重后再评分
  3. 历史数据对比:把每天的结果存到数据库,对比 Star 日增量,识别"爆发式增长"的项目
  4. 接入 AI 摘要:对 Top 1 项目自动抓取 README,调用 LLM 生成中文摘要

工作流文件

完整的 n8n 工作流 JSON 文件可以直接导入使用。需要的话发"GitHub监控"领取。


下一篇准备拆解 Dify 的本地部署,同样会记录完整的踩坑过程。关注不迷路。

相关推荐
逛逛GitHub2 小时前
这个 GitHub 项目很有意思啊,解了死磕30 年的前端难题。
github
m0_694845573 小时前
UVdesk部署教程:企业级帮助台系统实践
服务器·开发语言·后端·golang·github
程序员小崔日记3 小时前
一个命令救命:GitHub 爆火项目 thefuck,真把我笑服了
github·bash·开发者·宝藏项目
darkb1rd4 小时前
career-ops:Go 语言驱动 AI 求职系统实战指南
开源·github·好物分享
HakunamatataWang4 小时前
怎么把github的本地的repo上传给gitea
github·gitea
AI成长日志5 小时前
【GitHub开源项目专栏】AI推理优化框架深度解析(下):TGI与TensorRT-LLM对比实战
人工智能·开源·github
无限进步_5 小时前
【C++&string】寻找字符串中第一个唯一字符:两种经典解法详解
开发语言·c++·git·算法·github·哈希算法·visual studio
木下~learning5 小时前
零基础Git入门:Linux+Gitee实战指南
linux·git·gitee·github·虚拟机·版本控制·ubunt