# Apache Cloudberry 2.1.0 版本前瞻:内核、PXF 与备份生态持续演进

文章作者:王殿进,Apache Cloudberry PPMC 成员,承担 Apache Cloudberry 2.1.0 版本发布协调工作;整理:酷克数据

很高兴作为 Release manager 承担本次 Apache Cloudberry 2.1.0 的发布推进与协调工作。当前 2.1.0 仍处于社区投票流程中,尚未正式发布。不过,从当前 Release Candidate 所呈现出来的内容来看,2.1.0 已经清晰体现出 Apache Cloudberry 在数据库内核、生态组件现代化以及 Apache 社区工程治理方面的持续推进。2.1.0 版本也是我们首次将 Cloudberry 主仓库与组件一起联合推进版本发布,虽然流程上存在一些挑战,但最终可以让用户和开发者能够获得更一致的版本体验。

本篇文章不是正式的发布公告,仅为即将发布的 2.1.0 版本重要变更与亮点前瞻,不一而足。希望借这个机会,和大家分享一些用户和开发者更有体感的几项变化与改进。

一、Cloudberry 主仓库:内核能力与工程体系同步推进

在即将发布的 2.1.0 版本中,Apache Cloudberry 数据库主仓库既有面向用户和开发者的功能增强,也有不少面向长期演进的工程化改进。

内核与性能相关改进

  • 新增 UDP2 interconnect 协议实现:2.1.0 引入了新的 UDP2 interconnect 协议实现,目标在于将 interconnect 层与数据库内核进一步解耦。

  • 新增 MCP Server:2.1.0 版本中加入了 MCP Server 能力(需单独编译安装),为 Cloudberry 与 LLM 应用、AI 工具链的结合提供了新的接口能力,也让数据库与智能应用之间的连接方式更加自然。

  • PAX 存储继续增强:PAX 作为推出的行列混合存储引擎,在 2.1.0 中继续演进,新增了对 LZ4 列压缩的支持,同时在 I/O 读取与内存管理方面也有进一步优化。

  • AO 表支持 Fast ANALYZE:对于分析型场景中常见的 Append-Optimized 表,2.1.0 增加了 Fast ANALYZE 支持。

  • ORCA 优化器持续增强:本次版本中,ORCA 继续得到强化,包括:

    • CTE 输出列裁剪与无用 ColRef 裁剪
    • Partial Aggregate 下推到 Join 之下
    • 多项正确性修复、断言修复和内存泄漏修复
  • Runtime Filter Pushdown 持续演进:2.1.0 继续推进 Runtime Filter Pushdown 能力以及配套修复。

  • 等等。

开发者体验与发布工程改进

  • 增强发布分支测试与 ASF 合规检查:项目在 REL_2_STABLE 分支上新增版本二进制兼容测试工作流,同时进一步完善了 Apache RAT 相关检查,帮助版本发布流程与合规审计更稳健。

  • 开发工具链整合进主仓库:原先分散在其他仓库中的 cloudberry-devops-releasecloudberry-bootcamp 相关工作已经并入主仓库 devops 目录;沙箱环境 sandbox 也增加了本地模式,便于快速利用本地源码进行开发和验证。

  • 环境变量脚本完成切换:在 2.1 版本中,环境配置脚本已经从 greenplum_path.sh 完全切换到 cloudberry-env.sh。如果想了解这次切换背后的背景,你可以参考此前的博客《再见 greenplum_path.sh,你好 cloudberry-env.sh》

  • 移除 QuickLZ 支持:2.1.0 中移除了对 QuickLZ 的支持,用户可以转向 zlibzstd 等维护更活跃、生态更成熟的替代方案。

除了上述重点变化外,当前 2.1.0 候选版本中还包含了围绕 hot standby、灾备、工具链、测试与 CI 可移植性等方面的大量修复和增强。主仓库更多变更可参考:

https://github.com/apache/cloudberry/compare/2.0.0-incubating...2.1.0-incubating-rc2

二、Apache Cloudberry PXF:推进组件现代化

如果说主仓库体现的是数据库内核的持续演进,那么 Apache Cloudberry PXF 则是 2.1.0 发布版本中生态现代化最明显的组件之一。

  • 代码基线与 Apache 合规工作进一步完善:PXF 已经对齐已归档的 greenplum/pxf-archive 代码基线,并在这一更新后的基础上继续增强对 Cloudberry 2.1 的适配与支持。与此同时,仓库也完成了多项 Apache 合规相关清理工作,例如更新 DISCLAIMERLICENSENOTICE 等基础文件,并移除了源码中预置的 gradle-wrapper.jar 二进制文件,改为在编译过程中下载并验证通过后使用。

  • 工程体系更新:历史遗留的 Concourse CI 文件被移除,打造全新的 CI 工作流,更适配当前 Apache Cloudberry 的开发与验证方式。

  • 品牌与依赖体系统一:在 2.1.0 版本中,PXF 延续了整个 Cloudberry 社区的品牌统一工作:

    • Java 包声明从 org.greenplum 迁移到 org.apache.cloudberry
    • Go 依赖地址迁移到 apache/cloudberry-go-libs
  • 连接器与依赖库升级:本次 PXF 发布还有一组比较集中的生态依赖升级,包括:

    • Apache Avro 升级到较新的 Java 8 兼容版本,并补充了 zstd 相关支持
    • Apache ORC 升级到 1.7.11
    • Parquet 先升级到 1.12.3,随后进一步升级到 1.15.2,新增 ZSTDLZ4_RAW、vectored I/O 等能力支持
    • HBase Client 从 1.3.2 升级到 2.3.7

针对 PXF 现代化演进的工作在后续版本中将持续推进,如增加对 Java 17 的支持等等。PXF 更多变更可参考:

https://github.com/apache/cloudberry-pxf/compare/1.6.0...2.1.0-incubating-rc2

三、Apache Cloudberry Backup:体验优化与测试现代化

在备份生态方面,Apache Cloudberry Backup 也在 2.1.0 版本中完成了多项重要整理与演进。

  • 仓库更名与基线对齐:项目名称从 cloudberry-gpbackup 调整为 cloudberry-backup。同时,代码基线对齐到已归档的 greenplum/gpbackup-archive,并在此基础上增强对 Cloudberry 2.1 所需的适配工作。相关 Go 依赖也同步切换到了 apache/cloudberry-go-libs

  • S3 插件集成进主仓库:原先独立存在的 gpbackup-s3-plugin 已合并进入主仓库中的 plugins/s3plugin 目录。对于用户来说,这意味着在使用 S3 备份相关能力时,可以减少额外的单独编译和安装步骤,整体体验更简洁和一致。

  • Apache 合规与 CI 体系继续完善:2.1.0 版本中,Backup 仓库也持续进行了 Apache 合规相关整理,包括更新 LICENSE 和 NOTICE、移除遗留文件,并打造全新的 CI 工作流,覆盖 unit、integration、end-to-end、S3 plugin、scale 等多类测试。

Apache Cloudberry Backup 更多变更可参考:

https://github.com/apache/cloudberry-backup/compare/1.6.0...2.1.0-incubating-rc2

四、加入我们

虽然 Apache Cloudberry 2.1.0 当前还没有完成正式发布,但从当前 Release Candidate 的内容来看,这一版本已经展现出比较清晰的方向:

  • 主仓库继续推进数据库内核能力与查询、性能优化与增强
  • PXF、Backup 等生态组件持续增强 Apache 合规,推进现代化演进
  • 社区在发布工程、CI、合规治理与开发者体验上继续强化基础

如果 2.1.0 顺利通过社区投票,Apache Cloudberry 社区将通过官网、邮件列表等渠道发布正式公告。最终变更详情,请以官网公告为准。

同时,我们注重社区成员的反馈,计划在 2.1.0 正式发布后的一段时间内,提供包括 Cloudberry 主项目、cloudberry-pxf、cloudberry-backup 等组件的二进制便携包(DEB/RPM),方便开发者与用户快速体验 2.1.0 版本中的新功能。同时,推进其他非 Apache 官方仓库的生态组件的 2.1 适配与发布工作。

在 Apache Cloudberry 2.0 和 2.1 版本发布流程优化基础之上,我们在 2026 年也将加速新版本发布节奏,使得用户和开发者能够更快获取 Cloudberry 的最新能力。

欢迎大家继续关注和参与到 Apache Cloudberry 社区中来,一起见证 2.1.0 的发布:

相关推荐
AI架构师之家7 小时前
Apache Camel使用教程一
apache
yzx9910138 小时前
实时数据处理实战:使用 Apache Flink 消费 Kafka 数据并进行窗口聚合
flink·kafka·apache
Shepherd06191 天前
【IT 实战】Apache 反向代理 UniFi Controller 的终极指北(解决白屏、502、400 错误)
运维·网络·apache·it·unifi
额1291 天前
CentOS 7 安装apache部署discuz导入数据库表
数据库·centos·apache
qzhqbb1 天前
Nginx/Apache 访问规则
运维·nginx·apache
D愿你归来仍是少年2 天前
Apache Spark 第 8 章:Structured Streaming 流处理
大数据·spark·apache
努力的lpp3 天前
小迪安全第8天:基础入门-算法分析 & 传输加密 & 数据格式 & 密文存储 & 代码混淆 & 逆向保护
服务器·网络·apache
爱人间3 天前
apache-tomcat-8.5.72启动控制台乱码解决方案
java·tomcat·apache
XDHCOM3 天前
Apache Mesos科普,提升资源利用率与系统扩展性的开源平台
开源·apache