生产环境出现 bug 自动生成异常追踪-SRE渝开发自动化协同

作者:观测云 数据智能部 产品方案架构师 范莹莹

简介

生产环境 bug 的定义:RUM 应用和 APM 应用的 error_stack 信息被捕捉后成为 bug。

以 APM 新增错误巡检为例,当出现新错误时,在观测云控制台的「事件」模块下生成新的事件报告,捕捉为 bug。同时利用 Dataflux Func 创建异常追踪,调用观测云 OpenAPI ,在观测云控制台的「异常追踪」模块下新建 Issue,当重复出现 bug,合并至已有异常追踪。

实现流程

1.在观测云新建一个应用

根据接入的应用类型可分别查看对应文档

2.在 Dataflux Func 中安装APM 新增错误脚本或RUM 新增错误脚本。

3.根据 OpenAPI 接口在巡检 example 脚本中添加创建 issue 动作。

示例代码如下:

4.查看观测云控制台的「异常追踪」模块,可看到:

总结

对于智能巡检的所有脚本,都可以在生成事件报告时新建 issue。但因为在事件列表和异常追踪列表有重复的信息上报,所以往往不会有新建 issue 的动作。利用本篇最佳实践,用户可根据创建的 issue 在异常追踪列表对巡检事件进行修复跟踪,不需要再单独到事件列表寻找独立上报的事件进行跟踪。

相关推荐
balmtv11 分钟前
ChatGPT与Gemini官网联网搜索技术拆解:实时信息如何被准确获取?
人工智能·chatgpt
Σίσυφος190020 分钟前
格雷码详解
人工智能
可观测性用观测云24 分钟前
观测云推出 OpenClaw 可观测插件:从黑盒到白盒,让每次 AI 执行皆有迹可循
人工智能
阿里云大数据AI技术25 分钟前
告别“金鱼记忆”:Hologres + Mem0,为大模型打造企业级长记忆引擎
人工智能·llm
周末程序猿26 分钟前
技术总结|十分钟抓包逆向分析 `Claude-Code`
人工智能
Theodore_102230 分钟前
深度学习(11):偏差与方差诊断、学习曲线
人工智能·笔记·深度学习·神经网络·机器学习·计算机视觉
weixin_4361824236 分钟前
PLC 与 DCS 国产化报告获取:工控产业情报查找指南
大数据·人工智能·国产plc
金智维科技官方1 小时前
制造业如何用Ki-AgentS智能体平台实现设备巡检自动化?
大数据·运维·人工智能
stereohomology1 小时前
大模型看大模型:推理Token的能耗用电量比对
人工智能
Hello world.Joey1 小时前
Transformer解读
人工智能·深度学习·神经网络·自然语言处理·nlp·aigc·transformer