近日,在2025云栖大会ODPS专场论坛上,阿里云宣布自研大数据平台ODPS战略升级,全面支持AI计算和服务。正值ODPS十五周年之际,作为全球领先的算力底座,ODPS旗下三款核心产品ODPS-MaxCompute、ODPS-Hologres、ODPS-DataWorks协同发布,以"一体化、智能化、服务化"为核心,致力于为企业提供从数据治理、计算处理到智能服务的全链路AI原生能力,为自动驾驶实时决策、内容运营分析、智能广告精准投放等场景客户需求及千行百业提供下一代智能数据基础设施。
国家信息中心信息化和产业发展部主任、未来产业和平台经济研究中心主任单志广以"从大数据到数据要素,从数据融合到知识驱动"为主题致开场辞,他表示:当前,数据已经和土地、劳动力、资本、技术一样,成为驱动经济增长的核心动能。随着人工智能的发展,大数据平台需要从'计算数据'向'孵化智能'转变,从"数据驱动"向"知识驱动"转型,推动丰富的行业数据转化为知识资产,在国家"人工智能+"战略行动的指引下,共同推动人工智能与大数据产业的深度融合发展,着力打造AI原生的智能计算引擎,加速构建"要素化、智能化、生态化"的数据发展新格局,助力数字中国建设向更高水平、更高质量不断跃升。
国家信息中心信息化和产业发展部单志广主任现场致辞
ODPS-MaxCompute:AI原生高性能数据仓库全面升级
MaxCompute负责人张治国在会上分享此次MaxCompute的核心发布:作为ODPS的算力基石,MaxCompute本次升级聚焦于为AI工作负载提供极致弹性与高性能支撑。
性能与成本优化达到新高度:MaxCompute在 全托管、性价比、稳定及易用多方面提供企业级SaaS云数仓能力,支持存算分离,存算可独立扩展,集群自动弹性,用户可10秒内拉起10万CU计算。通过多租共享架构,租户可共享资源来提高资源利用率。 MaxCompute通过全链路性能优化,在实现BigQuery等友商产品快速搬站的同时,可降低50%以上成本。在海外客户的实际应用中,MaxCompute在真实Workload中的性能已达到竞品的1.8倍。
AI异构算力革命:面对复杂的AI计算场景,MaxCompute全面升级Data+AI场景的引擎能力。MaxCompute SQL 和 Python支持模型函数功能(MaxCompute AI Function),实现大模型与MaxCompute深度集成,提供开箱即用的Qwen3 系列、DeepSeek等主流模型及自定义模型托管能力,支持用户基于自身场景需求上传自定义模型,或链接远端模型服务。在算力上,全面支持CU/GU异构计算资源混合调度,用户可基于统一调度策略按需在SQL、Python作业中使用不同算力资源。
MaxFrame推出面向AI场景的新一代原生分布式Python引擎DPE,支持数据预处理,ML训练推理,异构资源计算,Python原生UDF以及AI Function等计算场景。
通义实验室通过MaxCompute的EB级数据存储能力和Serverless架构,实现大模型训练所需海量数据的高效清洗、去重工作,为通义千问&通义万相提供稳定可靠的数据支持 。
拓展近线计算能力引擎:MaxCompute支持基于 Delta Table 和 Delta Live MV 的增量计算 以及 MaxQA 查询加速 等特性,满足大数据业务从离线化、批处理 向 近实时化、Data+AI方向扩展,满足市场多样化计算场景需求。全新推出的Delta Table统一数据底座,支持离线+近实时一体化数据加工和分析,完全替代MaxCompute Table Format 1.0。Delta Live MV通过声明式SQL实现增量计算,免运维、自动数仓分层,有效平衡数据新鲜度与成本。
多模态数据管理: 在今年的升级中,MaxCompute提供更开放的数据交互能力,以湖仓一体的架构,支持更多样的数据模态的链接、管理与计算,同时为更多样的引擎提供便捷与安全的数据访问能力。通过MaxLake提供统一的Read/Write APIs和Catalog API,支持与开源工具深度集成。
ODPS-Hologres 4.0:一站式AI数据分析平台
Hologres负责人姜伟华在会上分享Hologres 4.0全新升级一站式AI数据分析平台,实现了向量 + 全文 + 标量的一站式多模混合查询,通过结合内置的AI Function一键部署大模型,轻松构建面向AI的一站式、多模态、高性能分析平台。

向量检索四项性价比世界第一 :全新自研的内存+磁盘混合索引 技术与RabitQ量化算法,在同等成本下,性能远超行业主流产品,以20%的内存成本实现95%以上的检索性能,单分片可支持0.5亿向量,助力企业低成本实现千亿向量数据的毫秒级检索,登顶 VectorDBBench 性价比榜单四项第一,实现高性能向量检索普惠化,成为全球最快向量数据库!
OLAP分析性能世界第一: 在原有TPC-H 30TB 性能世界第一的成绩下,Hologres 4.0继续刷新各类Benchmark性能测试,ClickBench 内表性能中国第一,湖表(Paimon)性能对比3.0提升100%,业界领先;JSONBench 在10亿行数据集下,性能中国第一;Hologres让云上客户跟随版本更新即可实现性能优化,享受云上技术红利。
多模一站式融合查询:在标量、向量基础上,支持高性能全文检索召回能力,对非结构化文本数据进行高性能搜索和召回,在搜索引擎、企业文档管理系统、日志分析平台等场景,帮助业务在海量非结构化文本数据中实现精准定位和知识挖掘。Hologres4.0 实现了"一份数据、多模分析",完美支撑RAG、多模态搜索等复杂场景。
AI Function原生集成大模型:内置AI Function ,在Hologres内可直接开通GPU,一键部署AI资源与模型,支持通过SQL直接调用模型进行推理;通过Object Table 构建索引直接访问OSS上的非结构化数据,并与Dynamic Table 联动进行数据增量加工,实现非结构化数据的自动、增量处理,并直接进行向量 + 全文 + 标量的一站式高性能多模混合查询。
理想汽车基于Hologres+Flink构建了万亿车联网信号毫秒级响应实时分析平台,在成本与原先持平的情况下,写入性能提升200%,实现万亿数据秒级写入。通过Hologres的JSONB存储分析能力支持10000+车机信号动态增减,满意业务灵活性需求。在增量场景使用Hologres Dynamic Table增量加工并使用Serverless资源按量付费,成本降低35%,需求交付效率提升10倍。
Hologres在高性能实时读写、增量计算、计算组隔离、Serverless,JSONB智能压缩存储等核心技术上突破,成功支撑理想汽车在智能座舱、智能诊断等核心业务链路迭代,实现万亿级数据洪流下的秒级决策。Hologres助力新能源汽车在智驾场景实现多模一站式高性能AI数据分析,加速产业智能化进程。
ODPS-DataWorks:从数据开发治理平台到"Data+AI"一体化数据中枢
DataWorks产品负责人田奇铣在会上分享此次DataWorks的核心发布,DataWorks数据开发治理平台向Data+AI一体化持续进化,演进为整个数据智能生态的"数据中枢"。
Data Studio,云原生Data+AI一体化开发平台:提供完全隔离的个人开发环境,支持CPU/GPU资源实例,可自定义容器镜像,支持Jupyter Notebook、Python、Qwen Code等工具,开发者可获得媲美本地开发环境的体验。同时Data Studio与PAI产品深度集成,提供AI/ML工程(PAI DLC/PAI Flow)及Gen AI应用开发(LangStudio),一站式构建Data+AI Pipeline,为大模型后训练、智能驾驶、具身智能等场景在半结构化与非结构化数据处理、数据科学及AI训练等工作上,为开发者提供高效、便捷的一站式开发体验。
智能服务,从Copilot到Agent的飞跃 :DataWorks Copilot 深度集成于SQL编辑器,通过接入Qwen3和DeepSeek系列模型提供智能代码补全、SQL生成、SQL优化等能力,并全新推出NES(Next Edit Suggestions)。全新发布的DataWorks Agent ,支持通过自然语言描述ETL需求,Agent可自主进行意图识别、需求理解、任务分解、代码编写、工作流构建与发布,自动化完成数据开发。同时,数据治理Agent将DataWorks主动式数据治理迈向全新的自主式数据治理阶段,不仅能够主动发现需要治理的问题,同时支持自主优化和解决问题。目前,DataWorks Agentic NL2SQL服务在被誉为"最接近真实企业场景"的 NL2SQL 权威榜单 Spider 2.0中,以61.24% 的执行准确率荣获榜单第一。
同时,全新发布 DataWorks ChatBI,以智能对话为核心,实现从问题理解到可视化报告的全流程自动化分析,助力业务人员高效完成复杂数据洞察。
触发式调度引擎:面向AI时代的数据处理需求,DataWorks自研的大规模任务调度引擎全新升级触发式调度能力,支持API、事件等多种方式触发,单集群每日可调度千万级任务,秒级调度延迟,分钟级故障自愈,高效、稳定驱动Data+AI Pipelines。
AI Function: DataWorks Serverless 资源组全新支持大模型部署,支持一键部署Qwen3、DeepSeek系列模型及Embedding模型,支持 DataWorks AI Function 便捷调用,小尺寸模型调用性能提升近10x。可在数据集成及数据处理过程中,实现如Embedding、文本打标、内容安全检测等,加速半结构化/非结构化数据处理效率。
多模态数据统一管理:从结构化数据到半结构化数据、非结构化数据,DataWorks全新推出多模态数据管理能力,支持多模态数据目录、语义检索,全新提供数据集管理,并可一键挂载至Data Studio个人开发环境,提供便捷访问。全新升级多模态端到端数据血缘,覆盖从数据集成、数据处理、AI训练、模型、推理服务全链路,实现数据可追溯,AI模型效果可跟踪。
ODPS迈向智能化的下一个十五年
走过十五年,ODPS从支撑阿里内部业务,到成为普惠的云上基础设施,再到今天全面拥抱AI,ODPS的每一次进化都紧扣技术发展的脉络。
阿里云通过AI原生一体化的智能数据平台,正持续降低AI技术的使用门槛,赋能千行百业挖掘数据价值,决胜AI新时代。