你的“数字同事”来了:DataWorks Data Agent 全面升级

在人工智能重塑生产力的今天,数据研发正在经历一场静默而深刻的变革------ 我们不再满足于"AI 写代码",而是期待它能真正听懂业务、理解流程、自主执行任务。

近日,阿里云 DataWorks Data Agent 全面升级。作为面向 AI 时代的全新智能体形态,它将大模型的认知能力与企业数据资产深度融合,支持自然语言交互、任务自主规划与端到端闭环执行,推动数据开发从"人驱动系统"迈向"系统主动服务"的新阶段。

一、什么是 DataWorks Data Agent?

阿里云 DataWorks Data Agent 是一款面向数据开发与治理场景的智能体数字员工。作为深度集成于 DataWorks 平台的一站式 AI 智能体,它突破了传统 Copilot "辅助建议"的局限,正式升级为可独立规划并执行复杂任务的数字化劳动力。

产品内置 Agent 智能体、代码编程助手、ChatBI 及快捷 AI 操作等核心能力,全面覆盖数据集成、开发、运维、治理与分析全链路。依托强大的 AI 推理与自然语言交互技术,用户仅需通过对话即可自动化完成数据集成、数据开发与运维、质量治理、数据分析等全周期任务,为企业带来高效、可信的智能化数据开发新体验。

DataWorks Data Agent 提供统一交互入口,支持 Chat 对话式 与 CLI 命令行双模体验。Chat 模式以自然语言降低使用门槛,实现"所说即所得";CLI 模式专注工程化集成,无缝对接脚本调度与 CI/CD 流水线,全面适配业务探索与技术集成的多元诉求。

DataWorks Data Agent Chat 模式

DataWorks Data Agent CLI 模式

二、全链路智能:覆盖数据集成、开发、治理、运维、分析五大场景

DataWorks Data Agent 的能力已全面覆盖数据研发生命周期,真正实现"一句话贯穿全链路"。

能力场景 传统方式(Before) Agent 模式(After) 提升
数据集成 (数据同步) 需深入理解数据源连接、字段映射逻辑、分区策略及调度依赖等专业概念。 一句话指令: "把MySQL每天新增数据同步到Hologres库" Agent 自动解析业务语义并生成标准配置。 ⏱️ 全过程 <2 分钟 不需要了解同步专业背景知识,只需关心业务,配置准确率提升
数据开发 (ETL 开发) 需求分析靠人工理解,数据探查靠手动查找,开发实施靠手动编写,测试验证及发布也是手动的。整个过程需要 12-23 小时。导致数据研发工作效率低下、规范执行困难、质量保障不足、知识复用困难。 输入: "请按照需求文档中的内容,构建"直播间商品成交数据"的ads层。" Agent 自动生成进行需求分析、创建节点、生成代码、配置依赖、发起发布 ⏱️ 端到端交付缩短至分钟级 研发效率从"天级"提升到"分钟级",需求评估到开发实施、测试验证、上线发布,每个环节都有 AI 自动完成,只有最终发布环节需要人工确认。真正实现了端到端智能化开发。
数据治理 (质量管控) 人工搜索对应表 → 查看表详情 → 查看字段样本内容 → 查看加工SQL → 配置规则 → 测试运行 → 查看测试结果 → 保存质量监控 被动响应,整改周期长达数日 下达指令: "针对用户表,自动配置表行数相关质量规则。 " Agent 智能分析指定表的字段类型、业务语义和重要性,自动推荐并配置合理监控规则, 全程留痕,支持审计 主动治理,闭环执行 规范执行率提升
数据地图 (元数据查找) 查数据、查依赖翻血缘图、问同事、看文档 确认变更靠日志或沟通,平均查找 >30 分钟 提问: "哪个表有用户的收货地址?" "谁改过这张宽表?" Agent 秒级返回结果 + 血缘 + 变更记录 查找效率提升 类似"与数据对话"
数据运维 (管理诊断) 任务失败后人工介入: 查日志、看依赖、比趋势...... 平均定位耗时 1~2 小时 任务实例失败后: 数据运维Agent会自动拉取任务日志、实例详情、操作日志、任务代码、最近运行情况等信息,生成诊断报告 +修复方案,用户授权后,数据运维Agent可直接执行运维操作进行任务修复 ⏱️ 诊断过程 <5 分钟 异常定位和修复效率直线提升,耗时从小时级降至分钟级
数据分析 (ChatBI) 业务提需求 → 分析师理解 → 探查 → 写查询 → 制图 → 沟通 → 输出 周期 1~3 天,难以实时决策 直接提问: "上个月各区域销售额同比如何?" "哪个类目流失用户最多?" → 自动识别口径,生成查询与图表 ⏱️ 从提问到洞察 <1 分钟 分析效率提升 零代码自助分析 支持多轮对话式探索

三、智能 ≠ 放任:安全与可控是 Agent 的第一准则

DataWorks Data Agent 最重要的话题------安全。安全与可控不是附加特性,而是 Data Agent 作为数字员工被企业信任的第一准则。

两大核心安全特性:

  • 身份透传------Agent 继承了当前用户在租户、空间、数据级的全部权限边界,权限变更实时同步;

  • 原生安全------DataWokrs的安全能力原生集成至 Agent 每一个操作中。

四大安全设计原则:

  • 第一,关键操作人工确认------高风险操作需经用户人工确认;

  • 第二,权限与 GUI 一致------ Agent 权限小于等于用户权限,不存在特权升级通道;

  • 第三,全程可审计------操作留痕、决策可追溯,关键行为全链路记录;

  • 第四,企业级合规------数据可信、操作可控,满足企业安全合规要求。

一句话总结:智能 ≠ 放任,做好安全,是 DataWorks Data Agent 被企业信赖的根基。

四、即刻体验,开启你的智能开发之旅

立即开通 DataWorks Data Agent: dataworks.data.aliyun.com/product/age...

查看官方文档: help.aliyun.com/zh/datawork...

相关推荐
Upsy-Daisy2 小时前
AI Agent 项目学习笔记(四):多轮对话与 ChatMemory 机制
人工智能
陈天伟教授2 小时前
图解人工智能(28)循环神经网络是如何实现记忆功能
人工智能·rnn·深度学习
老吴的商业笔记2 小时前
GEO 智能营销系统深度评测:从源码部署到 AI 搜索实效验证
人工智能
PhotonixBay2 小时前
金属增材制造表面测量:共聚焦显微镜参数优化实践
人工智能·测试工具·制造
码农阿强3 小时前
MiniMax speech-2.8-hd 技术详解与API接入实战
人工智能·ai·aigc
larance3 小时前
[菜鸟教程] 机器学习教程第五课-机器学习如何工作
人工智能·机器学习
云端行者3 小时前
LM Studio 0.4.13 踩坑实录:解决 JS Sandbox 的 Deno 缺失与网络权限问题
人工智能
一切皆是因缘际会3 小时前
依托记忆结构心智体系,AI 自主意识进化路径
大数据·人工智能·安全·搜索引擎·ai