文章作者:王殿进,Apache Cloudberry PPMC 成员,承担 Apache Cloudberry 2.1.0 版本发布协调工作;整理:酷克数据
很高兴作为 Release manager 承担本次 Apache Cloudberry 2.1.0 的发布推进与协调工作。当前 2.1.0 仍处于社区投票流程中,尚未正式发布。不过,从当前 Release Candidate 所呈现出来的内容来看,2.1.0 已经清晰体现出 Apache Cloudberry 在数据库内核、生态组件现代化以及 Apache 社区工程治理方面的持续推进。2.1.0 版本也是我们首次将 Cloudberry 主仓库与组件一起联合推进版本发布,虽然流程上存在一些挑战,但最终可以让用户和开发者能够获得更一致的版本体验。
本篇文章不是正式的发布公告,仅为即将发布的 2.1.0 版本重要变更与亮点前瞻,不一而足。希望借这个机会,和大家分享一些用户和开发者更有体感的几项变化与改进。
一、Cloudberry 主仓库:内核能力与工程体系同步推进
在即将发布的 2.1.0 版本中,Apache Cloudberry 数据库主仓库既有面向用户和开发者的功能增强,也有不少面向长期演进的工程化改进。
内核与性能相关改进
-
新增
UDP2 interconnect协议实现:2.1.0 引入了新的 UDP2 interconnect 协议实现,目标在于将interconnect层与数据库内核进一步解耦。 -
新增 MCP Server:2.1.0 版本中加入了 MCP Server 能力(需单独编译安装),为 Cloudberry 与 LLM 应用、AI 工具链的结合提供了新的接口能力,也让数据库与智能应用之间的连接方式更加自然。
-
PAX 存储继续增强:PAX 作为推出的行列混合存储引擎,在 2.1.0 中继续演进,新增了对
LZ4列压缩的支持,同时在 I/O 读取与内存管理方面也有进一步优化。 -
AO 表支持 Fast
ANALYZE:对于分析型场景中常见的 Append-Optimized 表,2.1.0 增加了 FastANALYZE支持。 -
ORCA 优化器持续增强:本次版本中,ORCA 继续得到强化,包括:
- CTE 输出列裁剪与无用
ColRef裁剪 - Partial Aggregate 下推到 Join 之下
- 多项正确性修复、断言修复和内存泄漏修复
- CTE 输出列裁剪与无用
-
Runtime Filter Pushdown 持续演进:2.1.0 继续推进 Runtime Filter Pushdown 能力以及配套修复。
-
等等。
开发者体验与发布工程改进
-
增强发布分支测试与 ASF 合规检查:项目在
REL_2_STABLE分支上新增版本二进制兼容测试工作流,同时进一步完善了 Apache RAT 相关检查,帮助版本发布流程与合规审计更稳健。 -
开发工具链整合进主仓库:原先分散在其他仓库中的
cloudberry-devops-release和cloudberry-bootcamp相关工作已经并入主仓库devops目录;沙箱环境sandbox也增加了本地模式,便于快速利用本地源码进行开发和验证。 -
环境变量脚本完成切换:在 2.1 版本中,环境配置脚本已经从
greenplum_path.sh完全切换到cloudberry-env.sh。如果想了解这次切换背后的背景,你可以参考此前的博客《再见 greenplum_path.sh,你好 cloudberry-env.sh》。 -
移除 QuickLZ 支持:2.1.0 中移除了对 QuickLZ 的支持,用户可以转向
zlib、zstd等维护更活跃、生态更成熟的替代方案。
除了上述重点变化外,当前 2.1.0 候选版本中还包含了围绕 hot standby、灾备、工具链、测试与 CI 可移植性等方面的大量修复和增强。主仓库更多变更可参考:
https://github.com/apache/cloudberry/compare/2.0.0-incubating...2.1.0-incubating-rc2
二、Apache Cloudberry PXF:推进组件现代化
如果说主仓库体现的是数据库内核的持续演进,那么 Apache Cloudberry PXF 则是 2.1.0 发布版本中生态现代化最明显的组件之一。
-
代码基线与 Apache 合规工作进一步完善:PXF 已经对齐已归档的
greenplum/pxf-archive代码基线,并在这一更新后的基础上继续增强对 Cloudberry 2.1 的适配与支持。与此同时,仓库也完成了多项 Apache 合规相关清理工作,例如更新DISCLAIMER、LICENSE、NOTICE等基础文件,并移除了源码中预置的gradle-wrapper.jar二进制文件,改为在编译过程中下载并验证通过后使用。 -
工程体系更新:历史遗留的 Concourse CI 文件被移除,打造全新的 CI 工作流,更适配当前 Apache Cloudberry 的开发与验证方式。
-
品牌与依赖体系统一:在 2.1.0 版本中,PXF 延续了整个 Cloudberry 社区的品牌统一工作:
- Java 包声明从
org.greenplum迁移到org.apache.cloudberry - Go 依赖地址迁移到
apache/cloudberry-go-libs
- Java 包声明从
-
连接器与依赖库升级:本次 PXF 发布还有一组比较集中的生态依赖升级,包括:
- Apache Avro 升级到较新的 Java 8 兼容版本,并补充了
zstd相关支持 - Apache ORC 升级到
1.7.11 - Parquet 先升级到
1.12.3,随后进一步升级到1.15.2,新增ZSTD、LZ4_RAW、vectored I/O 等能力支持 - HBase Client 从
1.3.2升级到2.3.7
- Apache Avro 升级到较新的 Java 8 兼容版本,并补充了
针对 PXF 现代化演进的工作在后续版本中将持续推进,如增加对 Java 17 的支持等等。PXF 更多变更可参考:
https://github.com/apache/cloudberry-pxf/compare/1.6.0...2.1.0-incubating-rc2
三、Apache Cloudberry Backup:体验优化与测试现代化
在备份生态方面,Apache Cloudberry Backup 也在 2.1.0 版本中完成了多项重要整理与演进。
-
仓库更名与基线对齐:项目名称从
cloudberry-gpbackup调整为cloudberry-backup。同时,代码基线对齐到已归档的greenplum/gpbackup-archive,并在此基础上增强对 Cloudberry 2.1 所需的适配工作。相关 Go 依赖也同步切换到了apache/cloudberry-go-libs。 -
S3 插件集成进主仓库:原先独立存在的
gpbackup-s3-plugin已合并进入主仓库中的plugins/s3plugin目录。对于用户来说,这意味着在使用 S3 备份相关能力时,可以减少额外的单独编译和安装步骤,整体体验更简洁和一致。 -
Apache 合规与 CI 体系继续完善:2.1.0 版本中,Backup 仓库也持续进行了 Apache 合规相关整理,包括更新 LICENSE 和 NOTICE、移除遗留文件,并打造全新的 CI 工作流,覆盖 unit、integration、end-to-end、S3 plugin、scale 等多类测试。
Apache Cloudberry Backup 更多变更可参考:
https://github.com/apache/cloudberry-backup/compare/1.6.0...2.1.0-incubating-rc2
四、加入我们
虽然 Apache Cloudberry 2.1.0 当前还没有完成正式发布,但从当前 Release Candidate 的内容来看,这一版本已经展现出比较清晰的方向:
- 主仓库继续推进数据库内核能力与查询、性能优化与增强
- PXF、Backup 等生态组件持续增强 Apache 合规,推进现代化演进
- 社区在发布工程、CI、合规治理与开发者体验上继续强化基础
如果 2.1.0 顺利通过社区投票,Apache Cloudberry 社区将通过官网、邮件列表等渠道发布正式公告。最终变更详情,请以官网公告为准。
同时,我们注重社区成员的反馈,计划在 2.1.0 正式发布后的一段时间内,提供包括 Cloudberry 主项目、cloudberry-pxf、cloudberry-backup 等组件的二进制便携包(DEB/RPM),方便开发者与用户快速体验 2.1.0 版本中的新功能。同时,推进其他非 Apache 官方仓库的生态组件的 2.1 适配与发布工作。
在 Apache Cloudberry 2.0 和 2.1 版本发布流程优化基础之上,我们在 2026 年也将加速新版本发布节奏,使得用户和开发者能够更快获取 Cloudberry 的最新能力。
欢迎大家继续关注和参与到 Apache Cloudberry 社区中来,一起见证 2.1.0 的发布: