回顾|Apache Cloudberry™ (Incubating) Meetup·2025 杭州站

2025 年 4 月 19 日,由酷克数据与中启乘数联合举办的 Apache Cloudberry™ (Incubating) Meetup · 杭州站在浙江省杭州市滨江区滨江会展中心成功举办。本次活动邀请了 Cloudberry PPMC 团队成员、活跃内核贡献者以及中兴 EBASE-A、阿里云 ADB-PG、网易、中启乘数等多家团队的顶尖技术专家,共同探讨 Cloudberry / Greenplum 内核前沿进展、一线生产实践和周边生态工具。活动现场气氛热烈,干货满满,为社区开发者与用户搭建了自由交流的平台,吸引线上线下近千名开发者与用户参与。

让我们一起回顾整场活动的议题干货吧!

Apache Cloudberry 简介与路线图展望

演讲嘉宾:杨瑜(Cloudberry PPMC 成员,酷克数据研发 VP,前 Greenplum 全球研发总监)

活动伊始,酷克数据研发 VP、Apache Cloudberry PPMC 成员杨瑜从项目背景、技术架构到未来规划,全面解读了 Apache Cloudberry 的发展蓝图。作为基于 Greenplum 和 PostgreSQL 的开源 MPP 数据库,Cloudberry 旨在通过开源模式将企业级优化成果回馈社区,解决闭源带来的不确定性。目前 Cloudberry 已正式进入 Apache 孵化器进行孵化,经过社区的充分讨论,已形成项目发展路线图;同时,社区正在准备推出第一个 Apache Release ------ Cloudberry 2.0。未来,Cloudberry 将聚焦内核升级、执行引擎优化及社区合作,携手开发者共建开源生态。

酷克数据HashData

Apache Cloudberry 向量化实践:向量数据重分布性能优化

演讲嘉宾:赵熙(Cloudberry 贡献者,内核研发工程师)

酷克数据内核研发工程师、Apache Cloudberry 贡献者赵熙聚焦向量化技术在Join+Motion数据重分布中的性能瓶颈,分享了Cloudberry从系统性能分析到优化落地的完整实践。通过Gandiva表达式优化与分组算法重构,显著降低CPU负载,512节点下耗时从2004ms降至180ms,提速11倍。结合内存布局优化与性能分析工具,有效提升向量化 Join+Motion 吞吐,为大规模查询提供高效支撑。这一分享为内核开发者提供了可落地的优化范式。

酷克数据HashData,赞1

EBASE-A 实时流式入库实现机制及应用实践

演讲嘉宾:柏楠(中兴 EBASE-A 团队工程师)

中兴 EBASE-A 团队工程师柏楠介绍了 EBASE-A 的实时流式入库架构及核心技术。作为支持多写多读、湖仓一体的 OLAP 数据库,EBASE-A 依托自研向量化引擎与存算分离架构实现 PB级分析。其 APFlow 组件通过零拷贝技术将吞吐推至磁盘极限,结合性能为 Flink 两倍的 Saturn 流引擎替代 JStorm 架构,资源消耗降低 50%,入库效率提升 30%,有效支撑通信行业实时数据处理。

酷克数据HashData,赞1

Data+AI 时代下的数据处理分析架构与技术演进 

演讲嘉宾:印才华(阿里云资深技术专家)

阿里云 ADB-PG 技术负责人、 阿里云资深技术专家印才华分享了企业在 Data + AI 背景下的数据分析架构演进,特别介绍了基于 Greenplum 构建的阿里云 ADB-PG 云数仓在高性能实时数仓、向量化,以及 In-Database AI 方面的探索洞察与行业用户融合实践。

酷克数据HashData

Greenplum/Cloudberry 第三方管控平台 APCC 详解

演讲嘉宾:唐成(中启乘数科技 CTO)

中启乘数 CTO 唐成分享第三方可视化管控平台 APCC 的设计理念与实践路径。APCC 平台支持多版本、跨平台部署,提供可视化集群管理、一键扩容、慢 SQL 优化等丰富能力,旨在通过"自动化 + 图形化"的方式大幅降低 Greenplum 及 Cloudberry 运维门槛,实现高效、智能的数据库运维。

酷克数据HashData

Apache SeaTunnel 架构解析与 Cloudberry 集成实践

演讲嘉宾:陈虹宇 (Apache SeaTunnel 贡献者,网易数据集成研发工程师)

最后,网易数据集成研发工程师、Apache SeaTunnel 贡献者陈虹宇详细介绍了 SeaTunnel 的核心架构及其与 Cloudberry 的集成方案。Apache SeaTunnel 是一个易用的支持海量数据同步的超高性能分布式数据集成平台;SeaTunnel 中的 Cloudberry 连接器基于标准 JDBC 构建,继承了 PostgreSQL 连接器的所有核心逻辑。通过简单命令,即可实现 Cloudberry 数据库的读写操作,无需复杂配置,使得数据流转更加轻松高效。未来,计划引入基于 gpfdist 协议和外部表机制的全新连接器,充分利用 Cloudberry 的并行计算能力,持续提升大规模数据迁移传输的性能表现。

酷克数据HashData

本次 Meetup 汇聚了来自社区与企业的一线技术力量,分享内容兼具深度与实战价值,涵盖数据库内核、数据集成、运维、AI 融合等多个关键方向,为开发者与用户搭建了高质量的技术交流平台。

特别感谢中启乘数对本次活动的全程支持与协作,也感谢每一位演讲嘉宾与参会者的积极投入,感谢 Apache SeaTunnel 等众多社区合作伙伴的支持!欢迎更多开发者、用户与企业伙伴加入 Apache Cloudberry 社区,共同打造开源时代的分布式数据基础设施!

相关推荐
Alfadi联盟 萧瑶5 分钟前
数据库与编程安全
数据库·安全
weixin_4708802619 分钟前
InnoDB引擎底层解析(二)之InnoDB的Buffer Pool(三)
数据库·程序人生·mysql·面试·sql优化·存储引擎
PWRJOY21 分钟前
Flask-SQLAlchemy数据库查询:query
数据库·flask·sqlalchemy
Allen_LVyingbo24 分钟前
传统医疗系统文档集中标准化存储和AI智能化更新路径分析
数据库·人工智能
hello1114-27 分钟前
Redis学习打卡-Day6-Redis 高可用(上)
数据库·redis·学习
luckyext1 小时前
SQL SERVER常用聚合函数整理及示例
运维·服务器·数据库·sql·mysql·sqlserver·mssql
时序数据说1 小时前
时序数据库IoTDB的分片与负载均衡策略深入解析
大数据·数据库·开源·负载均衡·时序数据库·iotdb
怡雪~1 小时前
redis的主从复制
数据库·redis·缓存
篱笆院的狗1 小时前
Redis 中的缓存击穿、缓存穿透和缓存雪崩是什么?
数据库·redis·缓存
两袖清风9982 小时前
【MySQL】 数据库基础&数据类型
数据库·mysql