观测云产品更新 | 应用性能监测、监控、场景、快照等

观测云更新

角色权限

1、仪表板权限细化:新增独立的"仪表板新建"权限,原有"仪表板管理"权限仍包含所有操作。分配"新建"权限时会自动开启仪表板、视图基础查看权限。

2、导航栏根据用户的权限动态显示。若某一角色在指定模块中未获得任何权限,该模块将不会在其左侧导航栏中显示。此规则适用于以下模块:云账单、付费计划与账单、场景、事件中心、基础设施、日志、指标、应用性能监测、用户访问监测、LLM 监测、可用性监测、监控、异常追踪、安全监测。

监控

1、告警策略:

  • 同时支持搜索和筛选对告警策略进行过滤;新增支持可按监控器名称(checker_title)、成员(member)进行精准筛选;
  • 重复告警:新增支持针对不同告警等级(如紧急、严重、警告等)分别设置重复告警的不发送时间间隔;
  • 新增通知聚合规则:"自定义"。支持根据业务需求自由指定用于告警聚合的字段组合。输入字段名(多个字段以英文逗号分隔),系统将严格按此组合进行聚合:仅当事件数据包含所有指定字段且取值均有效时,才会触发聚合告警。

2、Arbiter 内置的 DQL 函数支持通过传入工作空间参数,查询指定空间的数据。适用于可编程监控器SIEM 检测规则的创建与修改场景。

应用性能监测

1、性能指标

  • 新增 Apdex 统计,量化用户对应用性能的满意度;
  • 统计指标时序可视化:将服务列表中的平均请求数、响应时间、错误数等核心统计指标,从数值展示升级为时序图形式,直观呈现变化趋势。

2、服务详情

  • 支持 OpenTelemetry 服务语言的显示;
  • 新增 Tab 页:服务拓扑、Profile、仪表板。

场景

1、新增图表类型"变化对比图":将指定指标在当前时段与历史同期(如昨日同一时刻、上周同日)的数值或其他指标进行量化对比,并以直观方式展现变化幅度,从而快速识别异常波动;

2、新建饼图(环形图)时,当图例处于非隐藏状态,可选择是否显示 Value 值和 Value 百分比。

3、图表 Y 轴:优化原始数值展示。

快照

1、快照列表样式整体优化;

2、保存快照:新增"保存为静态时间"设置。

指标

指标分析:查询结果中的数值新增支持灵活的显示格式设置,可设置小数位数和全精度结果展示。

管理

1、跨工作空间授权:当数据范围选择"指标"时,可对指标授权范围进行细化配置

2、分享管理:新增类型快速筛选、搜索框。

Pipelines

每个数据类型新增支持设置两个默认 Pipeline(包括本地和中心 Pipeline)。

Open API

仪表板跨空间查询时支持指定默认选中空间。

集成更新

  • 新增 GCP Storage 集成;
  • 新增 GCP Cloud SQL(MySQL)集成;
  • 新增阿里云 VPC 对等连接集成;
  • 新增 AWS Lambda Trace 集成;
  • 新增阿里云 WAF 应用防火墙集成;
  • 补充腾讯云 Tencent CVM / KeewiDB 视图;
  • 修复 Ingress-nginx-prom 集成文档中大小写问题;
  • 修复集成文档问题(包括中英文字符及格式问题);
  • 修复 TencentCloud 公网 CLB 采集器以支持非公网 IP;
  • 修复 GCP 云监控中线性桶(linearBuckets)指标 Bug;
  • 新增 CSPM 规则:S3 存储桶策略应限制来自其他 AWS 账户的访问;
  • 新增云集成模板:Aliyun CPFS、Aliyun NLB、HuaweiCloud EVS、Aliyun CNAPIGateway、HuaweiCloud ROMA;
  • 新增云脚本:GCP APIs 采集器;
  • 新增云脚本:GCP RUN 采集器。

DataKit 更新

新加功能

  • 新增 Flameshot 用以支持动态 Profile 采集
  • Cloud meta 同步新增 Google Cloud 云主机支持

问题修复

  • 优化 Pipeline 对 null 字符的处理
  • 修复 Redis 主从模式中 slow log 采集问题
  • 修复 Pipeline Refer table 可能崩溃的问题
  • 修复一处 logfwd service/source 字段错误问题
  • 修复 OpenTelemetry 指标采集对 count 类指标的处理,增加额外的 tag __temporality,便于 GuanceDB 处理
  • 修复 DDTrace 采集器自定义 tag 无效问题

功能优化

  • 优化 service 启动行为,在启动过程中如果出现报错,会输出跟 service 启动有关的上下文信息,便于错误排查
  • 优化基于 Jolokia 的 JVM 和 Kafka 指标采集
  • HTTP API 白名单功能优化,增加基于正则的白名单配置和禁用白名单的选项
  • 优化 MongoDB 采集中错误日志处理
  • 优化 Redis 采集中关于权限的说明
  • 优化 DataKit 自身指标采集配置,新增 interval 配置入口,同时,自身指标中新增 eBPF 进程有关的 CPU/内存指标采集
  • DDTrace/OpenTelemetry trace 采集中新增 Trace SDK 名称/版本号/语言/公共字段提取
  • 主机对象采集支持虚拟机/物理机检测,可据此设定不同的采集 tag

兼容调整

  • Kafka 采集器做了较大调整,在这个版本中所有指标都归到 kafka 这个指标集下,且所有的指标都根据对应的 MBean 名称自动推导,不用人工配置采集的 MBean 以及其对应的指标命名
  • 移除了 OpenTelemetry 指标采集时的 global tag 追加
相关推荐
时光不负努力3 天前
适应AI 带来的变化与挑战
产品
用户559135782638 天前
第一张 K 线图 — matplotlib + mplfinance 实战
产品
爱勇宝8 天前
我做了一个亲子成长小程序:想把“催孩子”变成“看见孩子”
微信小程序·产品·全栈
用户559135782638 天前
量化系统定时任务实战:Cron + APScheduler + 企业微信通知
产品
用户559135782639 天前
量化系统 Docker 部署实战:docker-compose 一键拉起 PostgreSQL + 策略引擎
产品
修己xj9 天前
项目代号:吞金兽1.0 —— 从立项到半岁,一个家庭的项目管理实战纪实
产品
极客三刀流10 天前
idea执行maven里的生命周期,报错信息'powershell' 不是内部或外部命令,也不是可运行的程序 或批处理文件。 Cannot start maven from wrapper
产品
用户5591357826310 天前
量化交易 PostgreSQL 建表指南:K 线数据 + 信号记录 + 性能优化
产品
极客三刀流11 天前
windows版jdk版本管理工具
产品
用户5591357826314 天前
四大免费数据源代码实测
产品