观测云产品更新 | 应用性能监测、监控、场景、快照等

观测云更新

角色权限

1、仪表板权限细化:新增独立的"仪表板新建"权限,原有"仪表板管理"权限仍包含所有操作。分配"新建"权限时会自动开启仪表板、视图基础查看权限。

2、导航栏根据用户的权限动态显示。若某一角色在指定模块中未获得任何权限,该模块将不会在其左侧导航栏中显示。此规则适用于以下模块:云账单、付费计划与账单、场景、事件中心、基础设施、日志、指标、应用性能监测、用户访问监测、LLM 监测、可用性监测、监控、异常追踪、安全监测。

监控

1、告警策略:

  • 同时支持搜索和筛选对告警策略进行过滤;新增支持可按监控器名称(checker_title)、成员(member)进行精准筛选;
  • 重复告警:新增支持针对不同告警等级(如紧急、严重、警告等)分别设置重复告警的不发送时间间隔;
  • 新增通知聚合规则:"自定义"。支持根据业务需求自由指定用于告警聚合的字段组合。输入字段名(多个字段以英文逗号分隔),系统将严格按此组合进行聚合:仅当事件数据包含所有指定字段且取值均有效时,才会触发聚合告警。

2、Arbiter 内置的 DQL 函数支持通过传入工作空间参数,查询指定空间的数据。适用于可编程监控器SIEM 检测规则的创建与修改场景。

应用性能监测

1、性能指标

  • 新增 Apdex 统计,量化用户对应用性能的满意度;
  • 统计指标时序可视化:将服务列表中的平均请求数、响应时间、错误数等核心统计指标,从数值展示升级为时序图形式,直观呈现变化趋势。

2、服务详情

  • 支持 OpenTelemetry 服务语言的显示;
  • 新增 Tab 页:服务拓扑、Profile、仪表板。

场景

1、新增图表类型"变化对比图":将指定指标在当前时段与历史同期(如昨日同一时刻、上周同日)的数值或其他指标进行量化对比,并以直观方式展现变化幅度,从而快速识别异常波动;

2、新建饼图(环形图)时,当图例处于非隐藏状态,可选择是否显示 Value 值和 Value 百分比。

3、图表 Y 轴:优化原始数值展示。

快照

1、快照列表样式整体优化;

2、保存快照:新增"保存为静态时间"设置。

指标

指标分析:查询结果中的数值新增支持灵活的显示格式设置,可设置小数位数和全精度结果展示。

管理

1、跨工作空间授权:当数据范围选择"指标"时,可对指标授权范围进行细化配置

2、分享管理:新增类型快速筛选、搜索框。

Pipelines

每个数据类型新增支持设置两个默认 Pipeline(包括本地和中心 Pipeline)。

Open API

仪表板跨空间查询时支持指定默认选中空间。

集成更新

  • 新增 GCP Storage 集成;
  • 新增 GCP Cloud SQL(MySQL)集成;
  • 新增阿里云 VPC 对等连接集成;
  • 新增 AWS Lambda Trace 集成;
  • 新增阿里云 WAF 应用防火墙集成;
  • 补充腾讯云 Tencent CVM / KeewiDB 视图;
  • 修复 Ingress-nginx-prom 集成文档中大小写问题;
  • 修复集成文档问题(包括中英文字符及格式问题);
  • 修复 TencentCloud 公网 CLB 采集器以支持非公网 IP;
  • 修复 GCP 云监控中线性桶(linearBuckets)指标 Bug;
  • 新增 CSPM 规则:S3 存储桶策略应限制来自其他 AWS 账户的访问;
  • 新增云集成模板:Aliyun CPFS、Aliyun NLB、HuaweiCloud EVS、Aliyun CNAPIGateway、HuaweiCloud ROMA;
  • 新增云脚本:GCP APIs 采集器;
  • 新增云脚本:GCP RUN 采集器。

DataKit 更新

新加功能

  • 新增 Flameshot 用以支持动态 Profile 采集
  • Cloud meta 同步新增 Google Cloud 云主机支持

问题修复

  • 优化 Pipeline 对 null 字符的处理
  • 修复 Redis 主从模式中 slow log 采集问题
  • 修复 Pipeline Refer table 可能崩溃的问题
  • 修复一处 logfwd service/source 字段错误问题
  • 修复 OpenTelemetry 指标采集对 count 类指标的处理,增加额外的 tag __temporality,便于 GuanceDB 处理
  • 修复 DDTrace 采集器自定义 tag 无效问题

功能优化

  • 优化 service 启动行为,在启动过程中如果出现报错,会输出跟 service 启动有关的上下文信息,便于错误排查
  • 优化基于 Jolokia 的 JVM 和 Kafka 指标采集
  • HTTP API 白名单功能优化,增加基于正则的白名单配置和禁用白名单的选项
  • 优化 MongoDB 采集中错误日志处理
  • 优化 Redis 采集中关于权限的说明
  • 优化 DataKit 自身指标采集配置,新增 interval 配置入口,同时,自身指标中新增 eBPF 进程有关的 CPU/内存指标采集
  • DDTrace/OpenTelemetry trace 采集中新增 Trace SDK 名称/版本号/语言/公共字段提取
  • 主机对象采集支持虚拟机/物理机检测,可据此设定不同的采集 tag

兼容调整

  • Kafka 采集器做了较大调整,在这个版本中所有指标都归到 kafka 这个指标集下,且所有的指标都根据对应的 MBean 名称自动推导,不用人工配置采集的 MBean 以及其对应的指标命名
  • 移除了 OpenTelemetry 指标采集时的 global tag 追加
相关推荐
叶鹏10 天前
开源一个自己的作品浏览器插件ChaTab,一键提交Prompt到多个AI应用
小工具·产品
Alonse_沃虎电子13 天前
沃虎音频变压器:专业音频系统中的关键组件
网络·物联网·音视频·产品·方案·变压器·电子元器件
孟健20 天前
出海收款门槛又低了:PayPal 支持个人卖家账户(亲测 30 分钟通过)
ai编程·产品·创业
爱吃土豆的马铃薯ㅤㅤㅤㅤㅤㅤㅤㅤㅤ20 天前
数据埋点概念
产品
云轩奕鹤21 天前
智析单词书 - AI 驱动的深度英语词汇学习平台
前端·ai·产品·思维
可观测性用观测云21 天前
观测云产品更新 | 应用性能监测、场景、日志、用户访问监测等
产品
程序新视界21 天前
“提供溢出的情绪价值”是AI产品极具可能性的方向
人工智能·后端·产品
叁两22 天前
“死了么”用户数翻800倍,估值近1亿,那我来做个“活着呢”!
前端·人工智能·产品
Mintopia22 天前
TrustLink|产品概览(公开版)
人工智能·产品经理·产品
Vespeng23 天前
我用 Cloudflare 搭建了一个“数字分身”
人工智能·html·产品