用 n8n + GitHub API 搭建 AI 开源项目自动监控系统(Docker 部署 + 评分模型 + Lark推送)

背景

研究 GitHub 上 AI 自动化方向的开源项目(n8n、Dify、Flowise 这些),需要一个自动化的选题监控工具。手动刷 Trending 效率太低,而且 Trending 算法不一定能覆盖我关注的细分方向。

目标:每天定时搜索 GitHub 上 AI/Agent/工作流相关的高星项目,用自定义评分模型排序,推送 Top 5 到Lark群。

技术栈:n8n(Docker 自托管)+ GitHub REST API v3 + Lark Webhook。

最终效果

n8n 工作流 5 个节点:

scss 复制代码
Schedule Trigger → HTTP Request(GitHub API) → Code(评分) → Code(格式化) → HTTP Request(Lark)

每天 08:00 自动执行,Lark群收到格式化的 Top 5 项目列表。

GitHub API 踩坑

坑1:OR 操作符上限

GitHub Search API 限制单次查询最多 5 个逻辑操作符。超过直接返回 422:

json

json 复制代码
{"message":"Validation Failed","errors":[{"message":"More than five AND / OR / NOT operators were used."}]}

坑2:qualifier 不支持 OR

topic:ai-agent OR topic:automation 这种写法无效。topic: 是 qualifier,OR 只能连接 search term。

最终可用的 query:

复制代码
ai agent workflow automation stars:>1000 pushed:>2026-03-01

纯文本关键词(GitHub 做全文匹配)+ starspushed 两个 qualifier 过滤。

评分模型实现

在 n8n 的 Code 节点里用 JavaScript 实现。核心逻辑:

javascript

ini 复制代码
// 关键词库
const hotWords = [
  'agent','n8n','workflow','automation','llm','ai',
  'dify','langchain','flowise','mcp','claude',
  'deepseek','chatbot','rag','typebot','chatwoot',
  'self-hosted','no-code','low-code'
];

// 对每个 repo 评分
const all = `${desc} ${name} ${topics}`;
const hits = hotWords.filter(w => all.includes(w));

let score = 0;

// Star 总量 (0-25)
if (repo.stargazers_count > 50000) score += 25;
else if (repo.stargazers_count > 10000) score += 20;
else if (repo.stargazers_count > 3000) score += 15;
else score += 8;

// 关键词匹配 (0-30)
score += Math.min(hits.length * 6, 30);

// 更新活跃度 (0-20)
const days = Math.floor(
  (Date.now() - new Date(repo.pushed_at).getTime()) / 86400000
);
if (days <= 3) score += 20;
else if (days <= 14) score += 12;
else score += 5;

// 描述质量 (0-10)
if (repo.description && repo.description.length > 20) score += 10;

// 语言友好度 (0-15)
const easy = ['python','javascript','typescript','shell'];
if (easy.includes((repo.language || '').toLowerCase())) score += 15;
else score += 5;

满分 100,按分数降序取前 5。

Lark消息格式化

javascript

javascript 复制代码
const medals = ['🥇','🥈','🥉','4️⃣','5️⃣'];
items.forEach((item, i) => {
  const r = item.json;
  const s = r.stars >= 1000 
    ? (r.stars/1000).toFixed(1)+'k' : r.stars;
  msg += `${medals[i]} ${r.name}\n`;
  msg += `   ⭐${s} · ${r.lang} · 评分${r.score}\n`;
  msg += `   ${r.desc}\n`;
  msg += `   🔗 ${r.url}\n`;
  msg += `   🎯 ${r.keywords}\n\n`;
});

通过Lark自定义机器人 Webhook POST 发送,msg_type: "text"

部署

bash

bash 复制代码
# 一行命令部署 n8n
docker run -d --name n8n -p 5678:5678 \
  -v n8n_data:/home/node/.n8n \
  --restart always n8nio/n8n

导入工作流 JSON → 配置Lark Webhook URL → Publish 激活。

可优化方向

  1. 加 GitHub Token 认证:未认证的 API 限制 10 次/分钟,加 Token 后提升到 30 次/分钟
  2. 多次搜索合并:用不同关键词组合做 2-3 次搜索,合并去重后再评分
  3. 历史数据对比:把每天的结果存到数据库,对比 Star 日增量,识别"爆发式增长"的项目
  4. 接入 AI 摘要:对 Top 1 项目自动抓取 README,调用 LLM 生成中文摘要

工作流文件

完整的 n8n 工作流 JSON 文件可以直接导入使用。需要的话发"GitHub监控"领取。


下一篇准备拆解 Dify 的本地部署,同样会记录完整的踩坑过程。关注不迷路。

相关推荐
代码丰19 小时前
Github高赞项目50K learn-claude-code 的学习笔记总结
笔记·学习·github
是Yu欸20 小时前
SGLang 推理服务基础性能评测
android·数据库·大模型·github·昇腾·sglang·qwen3
Hommy8820 小时前
【开源剪映小助手】项目介绍
开源·github·aigc·剪映小助手
humors2211 天前
SSH管理github代码
运维·ssh·github
HelloGitHub1 天前
《HelloGitHub》第 121 期
开源·github
CoderJia程序员甲1 天前
GitHub 热榜项目 - 日榜(2026-04-27)
ai·大模型·llm·github
遇见火星1 天前
离线服务器时间同步NTP服务器配置
服务器·git·github
芝士就是力量啊 ೄ೨1 天前
如何配置Rust、Git,并从Github上拉下一个项目
git·rust·github
Reart1 天前
从0解构tinyWeb项目--(Day:9)
后端·架构·github
SparkleN.2 天前
mini-agent四个问题完善
前端·chrome·github