用 n8n + GitHub API 搭建 AI 开源项目自动监控系统（Docker 部署 + 评分模型 + Lark推送）

背景

研究 GitHub 上 AI 自动化方向的开源项目（n8n、Dify、Flowise 这些），需要一个自动化的选题监控工具。手动刷 Trending 效率太低，而且 Trending 算法不一定能覆盖我关注的细分方向。

目标：每天定时搜索 GitHub 上 AI/Agent/工作流相关的高星项目，用自定义评分模型排序，推送 Top 5 到Lark群。

技术栈：n8n（Docker 自托管）+ GitHub REST API v3 + Lark Webhook。

最终效果

n8n 工作流 5 个节点：

scss 复制代码

Schedule Trigger → HTTP Request(GitHub API) → Code(评分) → Code(格式化) → HTTP Request(Lark)

每天 08:00 自动执行，Lark群收到格式化的 Top 5 项目列表。

GitHub API 踩坑

坑1：OR 操作符上限

GitHub Search API 限制单次查询最多 5 个逻辑操作符。超过直接返回 422：

json

json 复制代码

{"message":"Validation Failed","errors":[{"message":"More than five AND / OR / NOT operators were used."}]}

坑2：qualifier 不支持 OR

topic:ai-agent OR topic:automation 这种写法无效。topic: 是 qualifier，OR 只能连接 search term。

最终可用的 query：

复制代码

ai agent workflow automation stars:>1000 pushed:>2026-03-01

纯文本关键词（GitHub 做全文匹配）+ stars 和 pushed 两个 qualifier 过滤。

评分模型实现

在 n8n 的 Code 节点里用 JavaScript 实现。核心逻辑：

javascript

ini 复制代码

// 关键词库
const hotWords = [
  'agent','n8n','workflow','automation','llm','ai',
  'dify','langchain','flowise','mcp','claude',
  'deepseek','chatbot','rag','typebot','chatwoot',
  'self-hosted','no-code','low-code'
];

// 对每个 repo 评分
const all = `${desc} ${name} ${topics}`;
const hits = hotWords.filter(w => all.includes(w));

let score = 0;

// Star 总量 (0-25)
if (repo.stargazers_count > 50000) score += 25;
else if (repo.stargazers_count > 10000) score += 20;
else if (repo.stargazers_count > 3000) score += 15;
else score += 8;

// 关键词匹配 (0-30)
score += Math.min(hits.length * 6, 30);

// 更新活跃度 (0-20)
const days = Math.floor(
  (Date.now() - new Date(repo.pushed_at).getTime()) / 86400000
);
if (days <= 3) score += 20;
else if (days <= 14) score += 12;
else score += 5;

// 描述质量 (0-10)
if (repo.description && repo.description.length > 20) score += 10;

// 语言友好度 (0-15)
const easy = ['python','javascript','typescript','shell'];
if (easy.includes((repo.language || '').toLowerCase())) score += 15;
else score += 5;

满分 100，按分数降序取前 5。

Lark消息格式化

javascript

javascript 复制代码

const medals = ['🥇','🥈','🥉','4️⃣','5️⃣'];
items.forEach((item, i) => {
  const r = item.json;
  const s = r.stars >= 1000 
    ? (r.stars/1000).toFixed(1)+'k' : r.stars;
  msg += `${medals[i]} ${r.name}\n`;
  msg += `   ⭐${s} · ${r.lang} · 评分${r.score}\n`;
  msg += `   ${r.desc}\n`;
  msg += `   🔗 ${r.url}\n`;
  msg += `   🎯 ${r.keywords}\n\n`;
});

通过Lark自定义机器人 Webhook POST 发送，msg_type: "text"。

部署

bash

bash 复制代码

# 一行命令部署 n8n
docker run -d --name n8n -p 5678:5678 \
  -v n8n_data:/home/node/.n8n \
  --restart always n8nio/n8n

导入工作流 JSON → 配置Lark Webhook URL → Publish 激活。

可优化方向

加 GitHub Token 认证：未认证的 API 限制 10 次/分钟，加 Token 后提升到 30 次/分钟
多次搜索合并：用不同关键词组合做 2-3 次搜索，合并去重后再评分
历史数据对比：把每天的结果存到数据库，对比 Star 日增量，识别"爆发式增长"的项目
接入 AI 摘要：对 Top 1 项目自动抓取 README，调用 LLM 生成中文摘要

工作流文件

完整的 n8n 工作流 JSON 文件可以直接导入使用。需要的话发"GitHub监控"领取。