在人工智能重塑生产力的今天,数据研发正在经历一场静默而深刻的变革------ 我们不再满足于"AI 写代码",而是期待它能真正听懂业务、理解流程、自主执行任务。
近日,阿里云 DataWorks Data Agent 全面升级。作为面向 AI 时代的全新智能体形态,它将大模型的认知能力与企业数据资产深度融合,支持自然语言交互、任务自主规划与端到端闭环执行,推动数据开发从"人驱动系统"迈向"系统主动服务"的新阶段。
一、什么是 DataWorks Data Agent?
阿里云 DataWorks Data Agent 是一款面向数据开发与治理场景的智能体数字员工。作为深度集成于 DataWorks 平台的一站式 AI 智能体,它突破了传统 Copilot "辅助建议"的局限,正式升级为可独立规划并执行复杂任务的数字化劳动力。
产品内置 Agent 智能体、代码编程助手、ChatBI 及快捷 AI 操作等核心能力,全面覆盖数据集成、开发、运维、治理与分析全链路。依托强大的 AI 推理与自然语言交互技术,用户仅需通过对话即可自动化完成数据集成、数据开发与运维、质量治理、数据分析等全周期任务,为企业带来高效、可信的智能化数据开发新体验。
DataWorks Data Agent 提供统一交互入口,支持 Chat 对话式 与 CLI 命令行双模体验。Chat 模式以自然语言降低使用门槛,实现"所说即所得";CLI 模式专注工程化集成,无缝对接脚本调度与 CI/CD 流水线,全面适配业务探索与技术集成的多元诉求。
DataWorks Data Agent Chat 模式
DataWorks Data Agent CLI 模式
二、全链路智能:覆盖数据集成、开发、治理、运维、分析五大场景
DataWorks Data Agent 的能力已全面覆盖数据研发生命周期,真正实现"一句话贯穿全链路"。
| 能力场景 | 传统方式(Before) | Agent 模式(After) | 提升 |
|---|---|---|---|
| 数据集成 (数据同步) | 需深入理解数据源连接、字段映射逻辑、分区策略及调度依赖等专业概念。 | 一句话指令: "把MySQL每天新增数据同步到Hologres库" Agent 自动解析业务语义并生成标准配置。 ⏱️ 全过程 <2 分钟 | 不需要了解同步专业背景知识,只需关心业务,配置准确率提升 |
| 数据开发 (ETL 开发) | 需求分析靠人工理解,数据探查靠手动查找,开发实施靠手动编写,测试验证及发布也是手动的。整个过程需要 12-23 小时。导致数据研发工作效率低下、规范执行困难、质量保障不足、知识复用困难。 | 输入: "请按照需求文档中的内容,构建"直播间商品成交数据"的ads层。" Agent 自动生成进行需求分析、创建节点、生成代码、配置依赖、发起发布 ⏱️ 端到端交付缩短至分钟级 | 研发效率从"天级"提升到"分钟级",需求评估到开发实施、测试验证、上线发布,每个环节都有 AI 自动完成,只有最终发布环节需要人工确认。真正实现了端到端智能化开发。 |
| 数据治理 (质量管控) | 人工搜索对应表 → 查看表详情 → 查看字段样本内容 → 查看加工SQL → 配置规则 → 测试运行 → 查看测试结果 → 保存质量监控 被动响应,整改周期长达数日 | 下达指令: "针对用户表,自动配置表行数相关质量规则。 " Agent 智能分析指定表的字段类型、业务语义和重要性,自动推荐并配置合理监控规则, 全程留痕,支持审计 | 主动治理,闭环执行 规范执行率提升 |
| 数据地图 (元数据查找) | 查数据、查依赖翻血缘图、问同事、看文档 确认变更靠日志或沟通,平均查找 >30 分钟 | 提问: "哪个表有用户的收货地址?" "谁改过这张宽表?" Agent 秒级返回结果 + 血缘 + 变更记录 | 查找效率提升 类似"与数据对话" |
| 数据运维 (管理诊断) | 任务失败后人工介入: 查日志、看依赖、比趋势...... 平均定位耗时 1~2 小时 | 任务实例失败后: 数据运维Agent会自动拉取任务日志、实例详情、操作日志、任务代码、最近运行情况等信息,生成诊断报告 +修复方案,用户授权后,数据运维Agent可直接执行运维操作进行任务修复 ⏱️ 诊断过程 <5 分钟 | 异常定位和修复效率直线提升,耗时从小时级降至分钟级 |
| 数据分析 (ChatBI) | 业务提需求 → 分析师理解 → 探查 → 写查询 → 制图 → 沟通 → 输出 周期 1~3 天,难以实时决策 | 直接提问: "上个月各区域销售额同比如何?" "哪个类目流失用户最多?" → 自动识别口径,生成查询与图表 ⏱️ 从提问到洞察 <1 分钟 | 分析效率提升 零代码自助分析 支持多轮对话式探索 |
三、智能 ≠ 放任:安全与可控是 Agent 的第一准则
DataWorks Data Agent 最重要的话题------安全。安全与可控不是附加特性,而是 Data Agent 作为数字员工被企业信任的第一准则。
两大核心安全特性:
-
身份透传------Agent 继承了当前用户在租户、空间、数据级的全部权限边界,权限变更实时同步;
-
原生安全------DataWokrs的安全能力原生集成至 Agent 每一个操作中。
四大安全设计原则:
-
第一,关键操作人工确认------高风险操作需经用户人工确认;
-
第二,权限与 GUI 一致------ Agent 权限小于等于用户权限,不存在特权升级通道;
-
第三,全程可审计------操作留痕、决策可追溯,关键行为全链路记录;
-
第四,企业级合规------数据可信、操作可控,满足企业安全合规要求。
一句话总结:智能 ≠ 放任,做好安全,是 DataWorks Data Agent 被企业信赖的根基。
四、即刻体验,开启你的智能开发之旅
立即开通 DataWorks Data Agent: dataworks.data.aliyun.com/product/age...
查看官方文档: help.aliyun.com/zh/datawork...