阿里云计算巢已上架!3分钟部署 Loki AI 事故分析引擎,SRE 复盘时间直接砍掉 80%

阿里云计算巢已上架!3分钟部署 Loki AI 事故分析引擎,SRE 复盘时间直接砍掉 80%

作者 :Luke
日期:2026年4月

凌晨告警一响,SRE 最怕的就是开始漫长地翻 Loki 日志、拼时间线、写复盘报告。

我自己也受够了这种折磨,于是开发了一个 Incident AI 事故分析引擎 ,现在已经成功上架阿里云计算巢

这个工具到底能干什么?

  • 自动从 Loki(支持 Prometheus)拉取异常日志
  • 使用 Qwen(通义千问)或 DeepSeek 大模型智能分析根因
  • 1-2 分钟生成结构化事故报告(严重等级、已确认根因、处理建议、时间线、AI置信度等)
  • 报告自动推送至企业微信(同时支持钉钉、飞书)

核心效果:把原来 1-2 小时的复盘工作,缩短到 10-20 分钟。

最推荐的部署方式:计算巢一键部署

我已经把服务正式发布到阿里云计算巢,支持完全私有化部署,数据全部留在你自己的阿里云账号里。

计算巢一键部署链接 (直接点开即可使用):

https://computenest.console.aliyun.com/service/instance/create/cn-hangzhou?type=user\&ServiceId=service-a98eb17b44db48c3a7b4\&userCode=3dzho3aj

部署流程超级简单

  1. 点击上方链接
  2. 填写 3 个核心参数:
    • LOKI_URL(你的 Loki 服务地址)
    • WECOM_WEBHOOK(企业微信机器人 Key)
    • AI_PROVIDER(选择 qwen 或 deepseek) + 对应 API Key
  3. 点击部署,几分钟后即可完成

开源项目地址(欢迎 Star 支持):

https://gitee.com/Luke-xuedong/incident-community

谁适合使用?

  • 使用 Spring Cloud + Loki 的微服务团队
  • 依赖企业微信做内部通知的公司
  • 经常值班、写事故报告的 SRE 和 DevOps 工程师

如何开始?

  1. 直接点击上方计算巢部署链接体验
  2. 有任何部署或使用问题,欢迎在 Gitee Issue 留言
  3. 需要自动定时分析、企业级支持或定制功能,可以私信我

目前基础功能已免费开放,如果你也经常被故障复盘和日志分析困扰,欢迎来试用!

计算巢一键部署地址

https://computenest.console.aliyun.com/service/instance/create/cn-hangzhou?type=user\&ServiceId=service-a98eb17b44db48c3a7b4\&userCode=3dzho3aj

开源地址

https://gitee.com/Luke-xuedong/incident-community

欢迎 Star、试用、反馈,一起让运维少熬夜!


相关推荐
亲爱的译官.几秒前
能精准双语翻译的智能手表!独立离线可用,全能好用更省心
人工智能·旅游·智能手表·亲爱的翻译官·翻译设备
风华圆舞几秒前
鸿蒙 + Flutter 下 AI 页面的状态协同设计
人工智能·flutter·harmonyos
马***4114 分钟前
科学高效学英语:全方位提升语言综合应用能力
人工智能
人工智能AI技术6 分钟前
AI‑Skills解锁效率天花板,告别低效闲聊式提问
人工智能
comcoo10 分钟前
告别复杂配置!Hermes Windows 极简部署流程详解【附部署包】
人工智能·开源软件·hermes·hermes部署包
qq_4112624210 分钟前
AI-01开发板编译、烧录与双配网模式说明
人工智能·ai·esp32-c2·四博
百度搜知知学社10 分钟前
ChatOn全新升级:融合GPT-4.0的AI聊天与绘画体验
人工智能·ai聊天·gpt-4.0·绘画生成·模型升级
TinssonTai10 分钟前
这个 VS Code 插件让我的 AI Coding 又快又稳 - 旧瓶装新酒
前端·人工智能·程序员
code_pgf12 分钟前
改进模型架构来减少MLLMs中的幻觉现象
人工智能·深度学习·算法
2301_7644413319 分钟前
基于AI的本地文件归档智能管理工具梳理
人工智能·python·算法·目标检测·交互