观测云更新
独占算力
观测云支持基于工作空间级别 购买独占算力资源。购买后,该空间的所有查询请求将使用独占算力节点执行,不再与其他空间共享查询资源,可极大提升查询体验。提供 Large、XLarge、4XLarge、8XLarge 等多种规格,按月计费。
Agent 监测
原 LLM 监测正式升级为 Agent 监测,同时作出以下更新:
1、应用列表:支持新建 Agent / LLM 两类应用,展示调用数、Token、耗时等核心指标;支持编辑与删除;

2、查看器:新增 Session 列表 与 Trace 列表,支持下钻查看瀑布图、调用详情及模型 / Skill / Tool 调用占比;



3、分析看板:Agent 应用展示请求、模型、Skill、Tool 四个分析模块,支持按 Agent 应用筛选查看。

管理
1、新增实验室:用于集中管理实验性功能。所有实验功能默认关闭,可按需手动开启,开启后仅在当前工作空间生效。
实验室下新增 "SLS 语言解析器"实验功能:

开启后,日志查看器支持使用标准 SLS 查询语法进行数据检索。

2、成员管理:
- 成员选择优化:所有成员选择下拉框(监控器权限、静默规则、告警策略、通知对象、场景可见范围、错误中心/故障中心等)支持同名成员区分展示(当列表中存在同名成员时,自动补充展示邮箱;名称与邮箱均相同时,进一步补充展示账号类型。已选中的成员标签同步遵循该规则)。
- 成员管理中手机号脱敏,计入审计。
- 成员管理列表优化:成员管理表格新增"账号类型"列。列表上方新增"设置"按钮,支持自定义显示列。设置结果同步应用于成员导出文件。

3、API Keys 管理 > 列表:新增显示列"最后调用时间",支持基于时间进行列表排序。

4、数据存储策略:增加 60 天、90天配置。
APM
链路查看器:点击"时间"或"持续时间"字段进行排序时,若该字段基数较大,系统新增弹出提示(由于该字段基数较大,执行后可能查询等待时间较长。建议先缩小查询范围后再排序。)您可选择取消或继续排序。
部署版
部署版自定义存储天数增加 60 天、90 天存储策略,存储上限延长至 3600 天。
DataKit 更新
新加功能
- 日志采集 socket logs 支持记录来源 IP,并使用
collector_source_ip作为来源地址 tag - 拨测 HTTP 任务支持自定义协议版本,便于覆盖不同 HTTP 协议兼容性场景
- PostgreSQL DBM 新增 SQL 执行量与 QPS 指标采集上报能力
- MongoDB 支持 database object 采集上报
- Doris 支持 object 采集上报
- bug report 默认支持通过 Dataway 上传,并保留 OSS 直传方式
- AWS Lambda 采集器完善函数调用链路,补充运行时事件与调用上下文关联能力
问题修复
- 修复 9529 HTTP API 未注册路由与未启用采集器路由的 403/404 返回策略,减少用户排障误导
- 修复 DataKit HTTP 服务启动失败时主进程状态仍显示正常的问题,现在 HTTP 服务异常会使主进程退出
- 修复 APM 自动注入在 arm64 动态库交叉编译与替换过程中的异常问题
- 修复 Redis 采集器偶现
concurrent map writes的问题,并优化 host tag 优先级处理
功能优化
- StatsD 默认关闭 DogStatsD event 与 service check 日志采集,仅在用户显式配置后开启,避免默认产生额外日志量
- 优化
DK_HTTP_LISTEN识别逻辑,支持直接填写ip:port,并明确其与DK_HTTP_PORT的优先级 - 优化 Pipeline 中 Grok 与 JSON 处理性能,提升日志处理吞吐
- eBPF 采集器移除 CGO 依赖,并优化 netlog/netflow/L7/exporter 内存使用与运行时观测能力
- 持续补充并优化日志自动多行规则,提升默认多行识别效果
- 补齐
cat、xfsquota、windowsremote、logfwdserver等采集器热加载能力 - 优化 DataKit 启动过程,移除初始化阶段不必要的采集行为,降低启动耗时
- OpenTelemetry 采集器复用
cliutils/otlp共享解析器,收敛 metrics/logs/traces 解析主循环并保持 DataKit 本地语义