技术栈
paimon
zhangkaixuan456
2 小时前
大数据
·
hadoop
·
flink
·
apache
·
paimon
Paimon 读取数据流程深度解析
📌 重要提示:本文档系统性地区分了主键表和非主键表的处理流程。建议先阅读《Paimon 主键表 vs 非主键表核心差异》了解基础概念。
zhangkaixuan456
10 小时前
大数据
·
数据库
·
flink
·
apache
·
paimon
paimon 主键表 vs 非主键表配置速查
快速决策工具:一页纸搞定主键表和非主键表的选择和配置是否是否需要 UPDATE/DELETE?主键表数据可能重复?
StarRocks_labs
16 小时前
数据库
·
starrocks
·
olap
·
淘宝
·
paimon
双 11 大促峰值不翻车:淘天集团 Paimon + StarRocks 大规模 OLAP 查询实战与优化
作者:朱奥 /淘天集团高级数据工程师导读:双 11 等大促场景会在短时间内集中爆发:运营与业务 BI 在开卖后的窗口期密集访问数据产品,瞬时请求量陡增,对查询引擎的稳定性、成本与治理体系提出极高要求。与此同时,业务对近实时数据产品的诉求持续增强,传统“多存储、多链路、依赖回刷”的模式在研发效率、回刷成本与响应速度上逐步暴露瓶颈。
阿华田512
5 天前
数据湖
·
paimon
·
数据湖建设
paimon实战-- 基于hive-catalog搭建paimon计算与存储环境
Apache Paimon 作为新一代 流批一体数据湖存储,在实时写入、近实时更新、主键表等场景下表现突出。相比 Iceberg / Hudi,Paimon 更偏向 Streaming-first 的设计,非常适合实时数仓与湖仓融合架构。
秦拿希
6 天前
大数据
·
trino
·
paimon
【paimon-trino】trino整合paimon元数据访问s3
研究paimon catalog,在flink paimon导入数据到s3后,需要用trino去查询。
zhangkaixuan456
1 个月前
java
·
大数据
·
flink
·
paimon
·
datalake
Paimon Action Jar 实现机制分析
Paimon Action Jar 是 Apache Paimon 提供的一套用于表维护操作的命令行工具框架。通过 flink run 命令,用户可以执行各种维护操作,如快照过期、分区删除、表压缩等。
鹿衔`
1 个月前
starrocks
·
apache
·
paimon
StarRocks 2.5.22 混合部署实战文档(CDH环境)
目录1. 项目背景与环境节点分配2. 核心规划 (避坑关键)2.1 端口规划表2.2 目录规划3. 部署前置准备 (nd11, nd12, nd13)
鹿衔`
1 个月前
linux
·
硬件架构
·
paimon
·
starroks
StarRocks 4.0.2 (CDH 环境)与Paimon数据湖集成混合部署文档
目录1. 项目背景与环境1.1 节点角色分配2. 核心规划 (关键避坑)2.1 端口规划表2.2 目录规划
鹿衔`
1 个月前
apache
·
doris
·
paimon
Apache Doris 2.1.10 集群部署与 Paimon 数据湖集成实战文档
目录1. 环境概述1.1 硬件与系统信息1.2 节点规划1.3 依赖组件 (CDH)2. 基础环境准备 (所有节点)
鹿衔`
1 个月前
flink
·
apache
·
doris
·
paimon
Apache Doris 4.0.1 集群部署与 Paimon 数据湖集成实战文档
目录1. 架构规划1.1 硬件与系统信息1.2节点分配1.3 依赖组件 (CDH)2. 操作系统基础配置 (所有节点)
zhangkaixuan456
2 个月前
大数据
·
hadoop
·
flink
·
apache
·
paimon
Flink Checkpoint 全生命周期深度解析
本文基于 Apache Paimon 项目源码,深入剖析 Flink Checkpoint 机制的完整生命周期,包含详细的源码分析和架构图解。
菜鸟冲锋号
2 个月前
大数据
·
flink
·
数据湖
·
paimon
·
多流外键关联
Paimon 流 - 流增量关联(CDC 模式)具体实现方案
核心逻辑:两个实时数据流(如订单流 + 支付流)通过 Debezium 捕获 binlog 后,分别以 CDC 模式写入 Paimon 表(Paimon 自动维护数据的 insert/update/delete 一致性),再通过 Flink 的 批查询(全量关联) 和 流查询(增量关联) 实现外键匹配,关联结果可持久化到 Paimon 关联表,供 Doris 等下游直接查询。
数据游戏
2 个月前
数据湖
·
paimon
paimon避坑指南
🔍 异常核心原因快照过期:Paimon 表的快照(Snapshot)ID 1691 已被清理,导致 Flink 作业无法读取该快照。
zhangkaixuan456
3 个月前
java
·
开发语言
·
微服务
·
flink
·
paimon
Flink 写入 Paimon 流程:Checkpoint 与 Commit 深度剖析
Flink 流式写入 Paimon 的架构采用了经典的**两阶段提交(2PC)**模式,与 Flink 的 Checkpoint 机制深度集成,实现了端到端的 Exactly-Once 语义保证。
黄雪超
3 个月前
大数据
·
数据湖
·
paimon
Paimon——官网阅读:理解文件
本文旨在阐明各种文件操作对文件的影响。本页面提供具体示例和实用技巧,以助力有效管理文件。此外,通过深入探讨诸如提交(commit)和压缩(compact)等操作,我们旨在深入解析文件的创建与更新过程。
zhangkaixuan456
3 个月前
java
·
apache
·
paimon
Apache Paimon 查询全流程深度分析
基于 Apache Paimon 源码,我将为您详细分析从用户发起查询到返回结果的完整流程。API 层组件:
zhangkaixuan456
3 个月前
java
·
大数据
·
apache
·
paimon
Apache Paimon 写入流程
目录1. 引言2. Paimon 核心架构与组件2.1. 整体架构分层2.2. 核心组件解析2.2.1. 文件系统与目录结构