观测云更新
角色权限
1、仪表板权限细化:新增独立的"仪表板新建"权限,原有"仪表板管理"权限仍包含所有操作。分配"新建"权限时会自动开启仪表板、视图基础查看权限。
2、导航栏根据用户的权限动态显示。若某一角色在指定模块中未获得任何权限,该模块将不会在其左侧导航栏中显示。此规则适用于以下模块:云账单、付费计划与账单、场景、事件中心、基础设施、日志、指标、应用性能监测、用户访问监测、LLM 监测、可用性监测、监控、异常追踪、安全监测。
监控
1、告警策略:
- 同时支持搜索和筛选对告警策略进行过滤;新增支持可按监控器名称(
checker_title)、成员(member)进行精准筛选;

- 重复告警:新增支持针对不同告警等级(如紧急、严重、警告等)分别设置重复告警的不发送时间间隔;

- 新增通知聚合规则:"自定义"。支持根据业务需求自由指定用于告警聚合的字段组合。输入字段名(多个字段以英文逗号分隔),系统将严格按此组合进行聚合:仅当事件数据包含所有指定字段且取值均有效时,才会触发聚合告警。

2、Arbiter 内置的 DQL 函数支持通过传入工作空间参数,查询指定空间的数据。适用于可编程监控器和 SIEM 检测规则的创建与修改场景。
应用性能监测
1、性能指标:
- 新增 Apdex 统计,量化用户对应用性能的满意度;
- 统计指标时序可视化:将服务列表中的平均请求数、响应时间、错误数等核心统计指标,从数值展示升级为时序图形式,直观呈现变化趋势。

2、服务详情:
- 支持 OpenTelemetry 服务语言的显示;
- 新增 Tab 页:服务拓扑、Profile、仪表板。

场景
1、新增图表类型"变化对比图":将指定指标在当前时段与历史同期(如昨日同一时刻、上周同日)的数值或其他指标进行量化对比,并以直观方式展现变化幅度,从而快速识别异常波动;

2、新建饼图(环形图)时,当图例处于非隐藏状态,可选择是否显示 Value 值和 Value 百分比。

3、图表 Y 轴:优化原始数值展示。
快照
1、快照列表样式整体优化;
2、保存快照:新增"保存为静态时间"设置。

指标
指标分析:查询结果中的数值新增支持灵活的显示格式设置,可设置小数位数和全精度结果展示。

管理
1、跨工作空间授权:当数据范围选择"指标"时,可对指标授权范围进行细化配置;

2、分享管理:新增类型快速筛选、搜索框。

Pipelines
每个数据类型新增支持设置两个默认 Pipeline(包括本地和中心 Pipeline)。
Open API
仪表板跨空间查询时支持指定默认选中空间。
集成更新
- 新增 GCP Storage 集成;
- 新增 GCP Cloud SQL(MySQL)集成;
- 新增阿里云 VPC 对等连接集成;
- 新增 AWS Lambda Trace 集成;
- 新增阿里云 WAF 应用防火墙集成;
- 补充腾讯云 Tencent CVM / KeewiDB 视图;
- 修复 Ingress-nginx-prom 集成文档中大小写问题;
- 修复集成文档问题(包括中英文字符及格式问题);
- 修复 TencentCloud 公网 CLB 采集器以支持非公网 IP;
- 修复 GCP 云监控中线性桶(linearBuckets)指标 Bug;
- 新增 CSPM 规则:S3 存储桶策略应限制来自其他 AWS 账户的访问;
- 新增云集成模板:Aliyun CPFS、Aliyun NLB、HuaweiCloud EVS、Aliyun CNAPIGateway、HuaweiCloud ROMA;
- 新增云脚本:GCP APIs 采集器;
- 新增云脚本:GCP RUN 采集器。
DataKit 更新
新加功能
- 新增 Flameshot 用以支持动态 Profile 采集
- Cloud meta 同步新增 Google Cloud 云主机支持
问题修复
- 优化 Pipeline 对 null 字符的处理
- 修复 Redis 主从模式中 slow log 采集问题
- 修复 Pipeline Refer table 可能崩溃的问题
- 修复一处 logfwd service/source 字段错误问题
- 修复 OpenTelemetry 指标采集对 count 类指标的处理,增加额外的 tag
__temporality,便于 GuanceDB 处理 - 修复 DDTrace 采集器自定义 tag 无效问题
功能优化
- 优化 service 启动行为,在启动过程中如果出现报错,会输出跟 service 启动有关的上下文信息,便于错误排查
- 优化基于 Jolokia 的 JVM 和 Kafka 指标采集
- HTTP API 白名单功能优化,增加基于正则的白名单配置和禁用白名单的选项
- 优化 MongoDB 采集中错误日志处理
- 优化 Redis 采集中关于权限的说明
- 优化 DataKit 自身指标采集配置,新增 interval 配置入口,同时,自身指标中新增 eBPF 进程有关的 CPU/内存指标采集
- DDTrace/OpenTelemetry trace 采集中新增 Trace SDK 名称/版本号/语言/公共字段提取
- 主机对象采集支持虚拟机/物理机检测,可据此设定不同的采集 tag
兼容调整
- Kafka 采集器做了较大调整,在这个版本中所有指标都归到 kafka 这个指标集下,且所有的指标都根据对应的 MBean 名称自动推导,不用人工配置采集的 MBean 以及其对应的指标命名
- 移除了 OpenTelemetry 指标采集时的 global tag 追加