回顾|Apache Cloudberry™ (Incubating) Meetup·2025 杭州站

2025 年 4 月 19 日,由酷克数据与中启乘数联合举办的 Apache Cloudberry™ (Incubating) Meetup · 杭州站在浙江省杭州市滨江区滨江会展中心成功举办。本次活动邀请了 Cloudberry PPMC 团队成员、活跃内核贡献者以及中兴 EBASE-A、阿里云 ADB-PG、网易、中启乘数等多家团队的顶尖技术专家,共同探讨 Cloudberry / Greenplum 内核前沿进展、一线生产实践和周边生态工具。活动现场气氛热烈,干货满满,为社区开发者与用户搭建了自由交流的平台,吸引线上线下近千名开发者与用户参与。

让我们一起回顾整场活动的议题干货吧!

Apache Cloudberry 简介与路线图展望

演讲嘉宾:杨瑜(Cloudberry PPMC 成员,酷克数据研发 VP,前 Greenplum 全球研发总监)

活动伊始,酷克数据研发 VP、Apache Cloudberry PPMC 成员杨瑜从项目背景、技术架构到未来规划,全面解读了 Apache Cloudberry 的发展蓝图。作为基于 Greenplum 和 PostgreSQL 的开源 MPP 数据库,Cloudberry 旨在通过开源模式将企业级优化成果回馈社区,解决闭源带来的不确定性。目前 Cloudberry 已正式进入 Apache 孵化器进行孵化,经过社区的充分讨论,已形成项目发展路线图;同时,社区正在准备推出第一个 Apache Release ------ Cloudberry 2.0。未来,Cloudberry 将聚焦内核升级、执行引擎优化及社区合作,携手开发者共建开源生态。

酷克数据HashData

Apache Cloudberry 向量化实践:向量数据重分布性能优化

演讲嘉宾:赵熙(Cloudberry 贡献者,内核研发工程师)

酷克数据内核研发工程师、Apache Cloudberry 贡献者赵熙聚焦向量化技术在Join+Motion数据重分布中的性能瓶颈,分享了Cloudberry从系统性能分析到优化落地的完整实践。通过Gandiva表达式优化与分组算法重构,显著降低CPU负载,512节点下耗时从2004ms降至180ms,提速11倍。结合内存布局优化与性能分析工具,有效提升向量化 Join+Motion 吞吐,为大规模查询提供高效支撑。这一分享为内核开发者提供了可落地的优化范式。

酷克数据HashData,赞1

EBASE-A 实时流式入库实现机制及应用实践

演讲嘉宾:柏楠(中兴 EBASE-A 团队工程师)

中兴 EBASE-A 团队工程师柏楠介绍了 EBASE-A 的实时流式入库架构及核心技术。作为支持多写多读、湖仓一体的 OLAP 数据库,EBASE-A 依托自研向量化引擎与存算分离架构实现 PB级分析。其 APFlow 组件通过零拷贝技术将吞吐推至磁盘极限,结合性能为 Flink 两倍的 Saturn 流引擎替代 JStorm 架构,资源消耗降低 50%,入库效率提升 30%,有效支撑通信行业实时数据处理。

酷克数据HashData,赞1

Data+AI 时代下的数据处理分析架构与技术演进 

演讲嘉宾:印才华(阿里云资深技术专家)

阿里云 ADB-PG 技术负责人、 阿里云资深技术专家印才华分享了企业在 Data + AI 背景下的数据分析架构演进,特别介绍了基于 Greenplum 构建的阿里云 ADB-PG 云数仓在高性能实时数仓、向量化,以及 In-Database AI 方面的探索洞察与行业用户融合实践。

酷克数据HashData

Greenplum/Cloudberry 第三方管控平台 APCC 详解

演讲嘉宾:唐成(中启乘数科技 CTO)

中启乘数 CTO 唐成分享第三方可视化管控平台 APCC 的设计理念与实践路径。APCC 平台支持多版本、跨平台部署,提供可视化集群管理、一键扩容、慢 SQL 优化等丰富能力,旨在通过"自动化 + 图形化"的方式大幅降低 Greenplum 及 Cloudberry 运维门槛,实现高效、智能的数据库运维。

酷克数据HashData

Apache SeaTunnel 架构解析与 Cloudberry 集成实践

演讲嘉宾:陈虹宇 (Apache SeaTunnel 贡献者,网易数据集成研发工程师)

最后,网易数据集成研发工程师、Apache SeaTunnel 贡献者陈虹宇详细介绍了 SeaTunnel 的核心架构及其与 Cloudberry 的集成方案。Apache SeaTunnel 是一个易用的支持海量数据同步的超高性能分布式数据集成平台;SeaTunnel 中的 Cloudberry 连接器基于标准 JDBC 构建,继承了 PostgreSQL 连接器的所有核心逻辑。通过简单命令,即可实现 Cloudberry 数据库的读写操作,无需复杂配置,使得数据流转更加轻松高效。未来,计划引入基于 gpfdist 协议和外部表机制的全新连接器,充分利用 Cloudberry 的并行计算能力,持续提升大规模数据迁移传输的性能表现。

酷克数据HashData

本次 Meetup 汇聚了来自社区与企业的一线技术力量,分享内容兼具深度与实战价值,涵盖数据库内核、数据集成、运维、AI 融合等多个关键方向,为开发者与用户搭建了高质量的技术交流平台。

特别感谢中启乘数对本次活动的全程支持与协作,也感谢每一位演讲嘉宾与参会者的积极投入,感谢 Apache SeaTunnel 等众多社区合作伙伴的支持!欢迎更多开发者、用户与企业伙伴加入 Apache Cloudberry 社区,共同打造开源时代的分布式数据基础设施!

相关推荐
手把手入门1 小时前
★CentOS:MySQL数据备份
数据库·mysql·adb
SelectDB2 小时前
5000+ 中大型企业首选的 Doris,在稳定性的提升上究竟花了多大的功夫?
大数据·数据库·apache
路多辛2 小时前
Golang database/sql 包深度解析(二):连接池实现原理
数据库·sql·golang
SimonKing2 小时前
Mybatis批量插入,形式不同性能也不同
数据库·后端·程序员
杰克尼3 小时前
MYSQL-175. 组合两个表
数据库·mysql
DemonAvenger3 小时前
MySQL索引原理深度解析与优化策略实战
数据库·mysql·性能优化
189228048614 小时前
NY270NY273美光固态闪存NY277NY287
服务器·网络·数据库·科技·性能优化
星霜笔记7 小时前
Docker 部署 MariaDB+phpMyAdmin+Nextcloud 完整教程
运维·数据库·docker·容器·mariadb
wyiyiyi13 小时前
【Web后端】Django、flask及其场景——以构建系统原型为例
前端·数据库·后端·python·django·flask
天宇_任13 小时前
Mysql数据库迁移到GaussDB注意事项
数据库·mysql·gaussdb