观测云产品更新 | 应用性能监测、监控、场景、快照等

观测云更新

角色权限

1、仪表板权限细化:新增独立的"仪表板新建"权限,原有"仪表板管理"权限仍包含所有操作。分配"新建"权限时会自动开启仪表板、视图基础查看权限。

2、导航栏根据用户的权限动态显示。若某一角色在指定模块中未获得任何权限,该模块将不会在其左侧导航栏中显示。此规则适用于以下模块:云账单、付费计划与账单、场景、事件中心、基础设施、日志、指标、应用性能监测、用户访问监测、LLM 监测、可用性监测、监控、异常追踪、安全监测。

监控

1、告警策略:

  • 同时支持搜索和筛选对告警策略进行过滤;新增支持可按监控器名称(checker_title)、成员(member)进行精准筛选;
  • 重复告警:新增支持针对不同告警等级(如紧急、严重、警告等)分别设置重复告警的不发送时间间隔;
  • 新增通知聚合规则:"自定义"。支持根据业务需求自由指定用于告警聚合的字段组合。输入字段名(多个字段以英文逗号分隔),系统将严格按此组合进行聚合:仅当事件数据包含所有指定字段且取值均有效时,才会触发聚合告警。

2、Arbiter 内置的 DQL 函数支持通过传入工作空间参数,查询指定空间的数据。适用于可编程监控器SIEM 检测规则的创建与修改场景。

应用性能监测

1、性能指标

  • 新增 Apdex 统计,量化用户对应用性能的满意度;
  • 统计指标时序可视化:将服务列表中的平均请求数、响应时间、错误数等核心统计指标,从数值展示升级为时序图形式,直观呈现变化趋势。

2、服务详情

  • 支持 OpenTelemetry 服务语言的显示;
  • 新增 Tab 页:服务拓扑、Profile、仪表板。

场景

1、新增图表类型"变化对比图":将指定指标在当前时段与历史同期(如昨日同一时刻、上周同日)的数值或其他指标进行量化对比,并以直观方式展现变化幅度,从而快速识别异常波动;

2、新建饼图(环形图)时,当图例处于非隐藏状态,可选择是否显示 Value 值和 Value 百分比。

3、图表 Y 轴:优化原始数值展示。

快照

1、快照列表样式整体优化;

2、保存快照:新增"保存为静态时间"设置。

指标

指标分析:查询结果中的数值新增支持灵活的显示格式设置,可设置小数位数和全精度结果展示。

管理

1、跨工作空间授权:当数据范围选择"指标"时,可对指标授权范围进行细化配置

2、分享管理:新增类型快速筛选、搜索框。

Pipelines

每个数据类型新增支持设置两个默认 Pipeline(包括本地和中心 Pipeline)。

Open API

仪表板跨空间查询时支持指定默认选中空间。

集成更新

  • 新增 GCP Storage 集成;
  • 新增 GCP Cloud SQL(MySQL)集成;
  • 新增阿里云 VPC 对等连接集成;
  • 新增 AWS Lambda Trace 集成;
  • 新增阿里云 WAF 应用防火墙集成;
  • 补充腾讯云 Tencent CVM / KeewiDB 视图;
  • 修复 Ingress-nginx-prom 集成文档中大小写问题;
  • 修复集成文档问题(包括中英文字符及格式问题);
  • 修复 TencentCloud 公网 CLB 采集器以支持非公网 IP;
  • 修复 GCP 云监控中线性桶(linearBuckets)指标 Bug;
  • 新增 CSPM 规则:S3 存储桶策略应限制来自其他 AWS 账户的访问;
  • 新增云集成模板:Aliyun CPFS、Aliyun NLB、HuaweiCloud EVS、Aliyun CNAPIGateway、HuaweiCloud ROMA;
  • 新增云脚本:GCP APIs 采集器;
  • 新增云脚本:GCP RUN 采集器。

DataKit 更新

新加功能

  • 新增 Flameshot 用以支持动态 Profile 采集
  • Cloud meta 同步新增 Google Cloud 云主机支持

问题修复

  • 优化 Pipeline 对 null 字符的处理
  • 修复 Redis 主从模式中 slow log 采集问题
  • 修复 Pipeline Refer table 可能崩溃的问题
  • 修复一处 logfwd service/source 字段错误问题
  • 修复 OpenTelemetry 指标采集对 count 类指标的处理,增加额外的 tag __temporality,便于 GuanceDB 处理
  • 修复 DDTrace 采集器自定义 tag 无效问题

功能优化

  • 优化 service 启动行为,在启动过程中如果出现报错,会输出跟 service 启动有关的上下文信息,便于错误排查
  • 优化基于 Jolokia 的 JVM 和 Kafka 指标采集
  • HTTP API 白名单功能优化,增加基于正则的白名单配置和禁用白名单的选项
  • 优化 MongoDB 采集中错误日志处理
  • 优化 Redis 采集中关于权限的说明
  • 优化 DataKit 自身指标采集配置,新增 interval 配置入口,同时,自身指标中新增 eBPF 进程有关的 CPU/内存指标采集
  • DDTrace/OpenTelemetry trace 采集中新增 Trace SDK 名称/版本号/语言/公共字段提取
  • 主机对象采集支持虚拟机/物理机检测,可据此设定不同的采集 tag

兼容调整

  • Kafka 采集器做了较大调整,在这个版本中所有指标都归到 kafka 这个指标集下,且所有的指标都根据对应的 MBean 名称自动推导,不用人工配置采集的 MBean 以及其对应的指标命名
  • 移除了 OpenTelemetry 指标采集时的 global tag 追加
相关推荐
Charlo20 小时前
简单对比glm4.6与minimaxm2.1
产品
akira09122 天前
滚动控制视频播放是如何实现的?GSAP ScrollTrigger + seek 实践 vivo官网案例
前端·产品
极限实验室4 天前
INFINI Labs 产品更新 - Coco AI v0.10 × Easysearch v2.0 联袂上线:UI 全面重构,体验焕然一新
数据库·人工智能·产品
磊磊磊磊磊6 天前
一周做了个文章排版工具,分享下如何高效省钱用AI!
ai编程·产品·cursor
敲敲敲敲暴你脑袋7 天前
晋江文学城账号安全简直就是笑话
安全·架构·产品
孟健9 天前
出海别再 1:1 抄站了:《毛选》给我的 6 条底层思考
ai编程·产品·创业
饭特稀AI10 天前
0 编程基础,他靠“克隆”爆款 App,狂揽 3.5 万美元/月
产品
前端阿森纳13 天前
AI产品经理的核心竞争力:在技术、用户与商业的交叉点上创造价值
产品经理·产品·资讯
前端阿森纳13 天前
七大产品设计方法论:构建卓越软件产品的思维工具箱
产品经理·产品·资讯