生产环境出现 bug 自动生成异常追踪-SRE渝开发自动化协同

作者:观测云 数据智能部 产品方案架构师 范莹莹

简介

生产环境 bug 的定义:RUM 应用和 APM 应用的 error_stack 信息被捕捉后成为 bug。

以 APM 新增错误巡检为例,当出现新错误时,在观测云控制台的「事件」模块下生成新的事件报告,捕捉为 bug。同时利用 Dataflux Func 创建异常追踪,调用观测云 OpenAPI ,在观测云控制台的「异常追踪」模块下新建 Issue,当重复出现 bug,合并至已有异常追踪。

实现流程

1.在观测云新建一个应用

根据接入的应用类型可分别查看对应文档

2.在 Dataflux Func 中安装APM 新增错误脚本或RUM 新增错误脚本。

3.根据 OpenAPI 接口在巡检 example 脚本中添加创建 issue 动作。

示例代码如下:

4.查看观测云控制台的「异常追踪」模块,可看到:

总结

对于智能巡检的所有脚本,都可以在生成事件报告时新建 issue。但因为在事件列表和异常追踪列表有重复的信息上报,所以往往不会有新建 issue 的动作。利用本篇最佳实践,用户可根据创建的 issue 在异常追踪列表对巡检事件进行修复跟踪,不需要再单独到事件列表寻找独立上报的事件进行跟踪。

相关推荐
罗西的思考2 小时前
AI Agent框架探秘:拆解 OpenHands(10)--- Runtime
人工智能·算法·机器学习
冬奇Lab3 小时前
OpenClaw 源码精读(2):Channel & Routing——一条消息如何找到它的 Agent?
人工智能·开源·源码阅读
冬奇Lab3 小时前
一天一个开源项目(第38篇):Claude Code Telegram - 用 Telegram 远程用 Claude Code,随时随地聊项目
人工智能·开源·资讯
格砸4 小时前
从入门到辞职|从ChatGPT到OpenClaw,跟上智能时代的进化
前端·人工智能·后端
可观测性用观测云5 小时前
可观测性 4.0:教系统如何思考
人工智能
sunny8655 小时前
Claude Code 跨会话上下文恢复:从 8 次纠正到 0 次的工程实践
人工智能·开源·github
小笼包包仔5 小时前
OpenClaw 多Agent软件开发最佳实践指南
人工智能
smallyoung5 小时前
AgenticRAG:智能体驱动的检索增强生成
人工智能
_skyming_5 小时前
OpenCode 如何做到结果不做自动质量评估,为什么结果还不错?
人工智能
南山安6 小时前
手写 Cursor 核心原理:从 Node.js 进程到智能 Agent
人工智能·agent·设计