技术栈
paimon
鹿衔`
3 天前
starrocks
·
apache
·
paimon
StarRocks 2.5.22 混合部署实战文档(CDH环境)
目录1. 项目背景与环境节点分配2. 核心规划 (避坑关键)2.1 端口规划表2.2 目录规划3. 部署前置准备 (nd11, nd12, nd13)
鹿衔`
3 天前
linux
·
硬件架构
·
paimon
·
starroks
StarRocks 4.0.2 (CDH 环境)与Paimon数据湖集成混合部署文档
目录1. 项目背景与环境1.1 节点角色分配2. 核心规划 (关键避坑)2.1 端口规划表2.2 目录规划
鹿衔`
3 天前
apache
·
doris
·
paimon
Apache Doris 2.1.10 集群部署与 Paimon 数据湖集成实战文档
目录1. 环境概述1.1 硬件与系统信息1.2 节点规划1.3 依赖组件 (CDH)2. 基础环境准备 (所有节点)
鹿衔`
3 天前
flink
·
apache
·
doris
·
paimon
Apache Doris 4.0.1 集群部署与 Paimon 数据湖集成实战文档
目录1. 架构规划1.1 硬件与系统信息1.2节点分配1.3 依赖组件 (CDH)2. 操作系统基础配置 (所有节点)
zhangkaixuan456
11 天前
大数据
·
hadoop
·
flink
·
apache
·
paimon
Flink Checkpoint 全生命周期深度解析
本文基于 Apache Paimon 项目源码,深入剖析 Flink Checkpoint 机制的完整生命周期,包含详细的源码分析和架构图解。
菜鸟冲锋号
13 天前
大数据
·
flink
·
数据湖
·
paimon
·
多流外键关联
Paimon 流 - 流增量关联(CDC 模式)具体实现方案
核心逻辑:两个实时数据流(如订单流 + 支付流)通过 Debezium 捕获 binlog 后,分别以 CDC 模式写入 Paimon 表(Paimon 自动维护数据的 insert/update/delete 一致性),再通过 Flink 的 批查询(全量关联) 和 流查询(增量关联) 实现外键匹配,关联结果可持久化到 Paimon 关联表,供 Doris 等下游直接查询。
数据游戏
16 天前
数据湖
·
paimon
paimon避坑指南
🔍 异常核心原因快照过期:Paimon 表的快照(Snapshot)ID 1691 已被清理,导致 Flink 作业无法读取该快照。
zhangkaixuan456
1 个月前
java
·
开发语言
·
微服务
·
flink
·
paimon
Flink 写入 Paimon 流程:Checkpoint 与 Commit 深度剖析
Flink 流式写入 Paimon 的架构采用了经典的**两阶段提交(2PC)**模式,与 Flink 的 Checkpoint 机制深度集成,实现了端到端的 Exactly-Once 语义保证。
黄雪超
1 个月前
大数据
·
数据湖
·
paimon
Paimon——官网阅读:理解文件
本文旨在阐明各种文件操作对文件的影响。本页面提供具体示例和实用技巧,以助力有效管理文件。此外,通过深入探讨诸如提交(commit)和压缩(compact)等操作,我们旨在深入解析文件的创建与更新过程。
zhangkaixuan456
1 个月前
java
·
apache
·
paimon
Apache Paimon 查询全流程深度分析
基于 Apache Paimon 源码,我将为您详细分析从用户发起查询到返回结果的完整流程。API 层组件:
zhangkaixuan456
1 个月前
java
·
大数据
·
apache
·
paimon
Apache Paimon 写入流程
目录1. 引言2. Paimon 核心架构与组件2.1. 整体架构分层2.2. 核心组件解析2.2.1. 文件系统与目录结构
StarRocks_labs
3 个月前
starrocks
·
数据湖
·
阿里巴巴
·
paimon
·
物化视图
淘宝闪购实时分析黑科技:StarRocks + Paimon撑起秋天第一波奶茶自由
作者:马龙杰(澄诺) 阿里巴巴中国电商事业群-饿了么-DIC 数据智能中心-数据研发流量组摘要:实时湖仓架构赋能即时零售,在多端流量与亿级营销投入下支撑分钟级决策与体验升级。
黄雪超
3 个月前
大数据
·
spark
·
数据湖
·
paimon
Paimon——官网阅读:Spark 引擎
Paimon目前支持Spark 3.5、3.4、3.3、3.2和3.1 。为获得更好的体验,我们推荐使用最新的Spark版本。
黄雪超
4 个月前
大数据
·
数据湖
·
paimon
Paimon——官网阅读:非主键表
如果一个表未定义主键,那么它就是一个追加表(append table)。与主键表相比,它不具备直接接收变更日志的能力。无法通过插入更新(upsert)直接用数据更新该表,只能接收追加的数据。
Made in Program
8 个月前
大数据
·
flink
·
paimon
从数据格式转换的角度 flink cdc 如何写入paimon?
从一个测试用例着手org/apache/flink/cdc/connectors/paimon/sink/v2/PaimonSinkITCase.java
血染河山
9 个月前
paimon
·
data-lake
Paimon merge into 实现原理
merge into 实际上是一个语法糖, 相对应的语义也可以通过其他的 sql 语法来表达, 例如 UPDATE/DELETE/INSERT, 但是 merge into 的好处是本身一次事务, 因此可以原子性的完成多个修改的操作.
undo_try
10 个月前
flink
·
bigdata
·
paimon
大数据组件(四)快速入门实时数据湖存储系统Apache Paimon(2)
Paimon的下载及安装,并且了解了主键表的引擎以及changelog-producer的含义参考:利用Paimon表做lookup join,集成mysql cdc等参考:
SelectDB技术团队
10 个月前
doris
·
数据湖
·
paimon
·
lakehouse
·
湖仓加速
湖仓分析|浙江霖梓基于 Doris + Paimon 打造实时/离线一体化湖仓架构
导读:浙江霖梓早期使用 CDH 产品套件搭建了大数据系统,面临业务逻辑冗余、查询效率低下等问题,基于 Apache Doris 进行整体架构与表结构的重构,并基于湖仓一体和查询加速展开深度探索与实践,打造了 Doris + Paimon 的实时/离线一体化湖仓架构,实现查询提速 30 倍、资源成本节省 67% 等显著成效。
孙中明
1 年前
apache
·
paimon
·
大数据精读周刊
008.精读《Apache Paimon Docs - Table w/o PK》
通过本文,上篇我们了解了Apache Paimon 主键表,本期我们将继续学习附加表(Append Only Table) 我们将带领读者《 《Apache Paimon Docs - Table w/o PK》》 继续剖析 Paimon 的仅追加表相关知识。