背景
研究 GitHub 上 AI 自动化方向的开源项目(n8n、Dify、Flowise 这些),需要一个自动化的选题监控工具。手动刷 Trending 效率太低,而且 Trending 算法不一定能覆盖我关注的细分方向。
目标:每天定时搜索 GitHub 上 AI/Agent/工作流相关的高星项目,用自定义评分模型排序,推送 Top 5 到Lark群。
技术栈:n8n(Docker 自托管)+ GitHub REST API v3 + Lark Webhook。
最终效果
n8n 工作流 5 个节点:
scss
Schedule Trigger → HTTP Request(GitHub API) → Code(评分) → Code(格式化) → HTTP Request(Lark)
每天 08:00 自动执行,Lark群收到格式化的 Top 5 项目列表。
GitHub API 踩坑
坑1:OR 操作符上限
GitHub Search API 限制单次查询最多 5 个逻辑操作符。超过直接返回 422:
json
json
{"message":"Validation Failed","errors":[{"message":"More than five AND / OR / NOT operators were used."}]}
坑2:qualifier 不支持 OR
topic:ai-agent OR topic:automation 这种写法无效。topic: 是 qualifier,OR 只能连接 search term。
最终可用的 query:
ai agent workflow automation stars:>1000 pushed:>2026-03-01
纯文本关键词(GitHub 做全文匹配)+ stars 和 pushed 两个 qualifier 过滤。
评分模型实现
在 n8n 的 Code 节点里用 JavaScript 实现。核心逻辑:
javascript
ini
// 关键词库
const hotWords = [
'agent','n8n','workflow','automation','llm','ai',
'dify','langchain','flowise','mcp','claude',
'deepseek','chatbot','rag','typebot','chatwoot',
'self-hosted','no-code','low-code'
];
// 对每个 repo 评分
const all = `${desc} ${name} ${topics}`;
const hits = hotWords.filter(w => all.includes(w));
let score = 0;
// Star 总量 (0-25)
if (repo.stargazers_count > 50000) score += 25;
else if (repo.stargazers_count > 10000) score += 20;
else if (repo.stargazers_count > 3000) score += 15;
else score += 8;
// 关键词匹配 (0-30)
score += Math.min(hits.length * 6, 30);
// 更新活跃度 (0-20)
const days = Math.floor(
(Date.now() - new Date(repo.pushed_at).getTime()) / 86400000
);
if (days <= 3) score += 20;
else if (days <= 14) score += 12;
else score += 5;
// 描述质量 (0-10)
if (repo.description && repo.description.length > 20) score += 10;
// 语言友好度 (0-15)
const easy = ['python','javascript','typescript','shell'];
if (easy.includes((repo.language || '').toLowerCase())) score += 15;
else score += 5;
满分 100,按分数降序取前 5。
Lark消息格式化
javascript
javascript
const medals = ['🥇','🥈','🥉','4️⃣','5️⃣'];
items.forEach((item, i) => {
const r = item.json;
const s = r.stars >= 1000
? (r.stars/1000).toFixed(1)+'k' : r.stars;
msg += `${medals[i]} ${r.name}\n`;
msg += ` ⭐${s} · ${r.lang} · 评分${r.score}\n`;
msg += ` ${r.desc}\n`;
msg += ` 🔗 ${r.url}\n`;
msg += ` 🎯 ${r.keywords}\n\n`;
});
通过Lark自定义机器人 Webhook POST 发送,msg_type: "text"。
部署
bash
bash
# 一行命令部署 n8n
docker run -d --name n8n -p 5678:5678 \
-v n8n_data:/home/node/.n8n \
--restart always n8nio/n8n
导入工作流 JSON → 配置Lark Webhook URL → Publish 激活。
可优化方向
- 加 GitHub Token 认证:未认证的 API 限制 10 次/分钟,加 Token 后提升到 30 次/分钟
- 多次搜索合并:用不同关键词组合做 2-3 次搜索,合并去重后再评分
- 历史数据对比:把每天的结果存到数据库,对比 Star 日增量,识别"爆发式增长"的项目
- 接入 AI 摘要:对 Top 1 项目自动抓取 README,调用 LLM 生成中文摘要
工作流文件
完整的 n8n 工作流 JSON 文件可以直接导入使用。需要的话发"GitHub监控"领取。
下一篇准备拆解 Dify 的本地部署,同样会记录完整的踩坑过程。关注不迷路。