文档结构
| 能力 | Iceberg | Delta Lake (OSS) | Hudi | Paimon |
|---|---|---|---|---|
| 核心定位 | 开放标准湖仓 | Spark 生态湖仓 | 实时写入优化 | Flink 原生流批一体存储 |
| Flink 写入 | 事务写入成熟 | 仅读取 | CDC 场景强 | 原生集成,无需 Connector |
| Spark 写入 | √ | √ | 实验性支持,性能一般 | - |
| Upsert 性能 | CoW 支持;MOR 孵化 | MOR 支持(中等) | MOR 延迟最低(Flink CDC) | Changelog 模式,端到端 < 1s |
| 多引擎查询 | Trino/StarRocks 原生 | 需 Standalone | 依赖 Hive Sync | Trino 420+、StarRocks 3.2+ 支持 |
| Schema Evolution | 列增删改 | 列增改 | 列增改 | 列增改,删除需 soft delete |
| 小文件治理 | 异步 Compaction | 自动 Optimize | Clustering + Compaction | 自动合并(LSM 结构天然抗小文件) |
| 典型场景 | 多引擎分析、开放生态 | Databricks 用户、Spark 主导 | 高频 CDC、Flink + Spark 混合 | 纯 Flink 实时链路、流批统一存储 |
===================================== over ================================================