阿里云计算巢已上架!3分钟部署 Loki AI 事故分析引擎,SRE 复盘时间直接砍掉 80%

阿里云计算巢已上架!3分钟部署 Loki AI 事故分析引擎,SRE 复盘时间直接砍掉 80%

作者 :Luke
日期:2026年4月

凌晨告警一响,SRE 最怕的就是开始漫长地翻 Loki 日志、拼时间线、写复盘报告。

我自己也受够了这种折磨,于是开发了一个 Incident AI 事故分析引擎 ,现在已经成功上架阿里云计算巢

这个工具到底能干什么?

  • 自动从 Loki(支持 Prometheus)拉取异常日志
  • 使用 Qwen(通义千问)或 DeepSeek 大模型智能分析根因
  • 1-2 分钟生成结构化事故报告(严重等级、已确认根因、处理建议、时间线、AI置信度等)
  • 报告自动推送至企业微信(同时支持钉钉、飞书)

核心效果:把原来 1-2 小时的复盘工作,缩短到 10-20 分钟。

最推荐的部署方式:计算巢一键部署

我已经把服务正式发布到阿里云计算巢,支持完全私有化部署,数据全部留在你自己的阿里云账号里。

计算巢一键部署链接 (直接点开即可使用):

https://computenest.console.aliyun.com/service/instance/create/cn-hangzhou?type=user\&ServiceId=service-a98eb17b44db48c3a7b4\&userCode=3dzho3aj

部署流程超级简单

  1. 点击上方链接
  2. 填写 3 个核心参数:
    • LOKI_URL(你的 Loki 服务地址)
    • WECOM_WEBHOOK(企业微信机器人 Key)
    • AI_PROVIDER(选择 qwen 或 deepseek) + 对应 API Key
  3. 点击部署,几分钟后即可完成

开源项目地址(欢迎 Star 支持):

https://gitee.com/Luke-xuedong/incident-community

谁适合使用?

  • 使用 Spring Cloud + Loki 的微服务团队
  • 依赖企业微信做内部通知的公司
  • 经常值班、写事故报告的 SRE 和 DevOps 工程师

如何开始?

  1. 直接点击上方计算巢部署链接体验
  2. 有任何部署或使用问题,欢迎在 Gitee Issue 留言
  3. 需要自动定时分析、企业级支持或定制功能,可以私信我

目前基础功能已免费开放,如果你也经常被故障复盘和日志分析困扰,欢迎来试用!

计算巢一键部署地址

https://computenest.console.aliyun.com/service/instance/create/cn-hangzhou?type=user\&ServiceId=service-a98eb17b44db48c3a7b4\&userCode=3dzho3aj

开源地址

https://gitee.com/Luke-xuedong/incident-community

欢迎 Star、试用、反馈,一起让运维少熬夜!


相关推荐
阳光是sunny18 小时前
别再被 worktree 绕晕了!AI 编程时代你必须掌握的 Git 隔离神器
前端·人工智能·后端
冬奇Lab18 小时前
每日一个开源项目(第148篇):obsidian-skills - Obsidian CEO 亲写的 AI Agent 格式规范,让 Agent 不再破坏你的 Vault
人工智能·开源·资讯
ethantan18 小时前
AI Agent 组成:像人一样思考的智能体
人工智能·程序员·架构
冬奇Lab19 小时前
Workflow 系列(05):评测体系——三层测试结构与 Trace 追踪
人工智能·工作流引擎
ethantan19 小时前
一篇讲解AI Agent 组成:像人一样思考的智能体
人工智能·后端·程序员
Cosolar21 小时前
vLLM 生产级部署完全指南
人工智能·后端·架构
CodePlayer竟然被占用了21 小时前
被美国政府封杀18天,Claude Fable 5 回来了——但代价是什么?
人工智能
IT_陈寒1 天前
垃圾回收器选错了,我的Java服务内存炸了
前端·人工智能·后端
smartpi1 天前
SmartPi GPIO 脉冲与回复语执行时序指南
人工智能
阿里云大数据AI技术1 天前
PAI支持一键部署GLM-5.2,Coding能力比肩Claude Opus 4.8
人工智能