flink cdc系列

最笨的羊羊17 天前
pipeline·schema·kafka sink·flink cdc系列·serialization·序列化器·kafkarecord
Flink CDC系列之:Kafka Sink 的序列化器PipelineKafkaRecordSerializationSchema这是一个 Flink CDC Kafka Sink 的序列化器,负责将 Change Data Capture (CDC) 事件序列化为 Kafka 消息。
最笨的羊羊18 天前
json·flink cdc系列·changelog·kafka 变更日志·json 格式工厂类·formatfactory
Flink CDC系列之:Kafka 变更日志 JSON 格式工厂类 ChangeLogJsonFormatFactory类概述核心方法详解 createSerializationSchema() - 创建序列化器参数说明:
最笨的羊羊18 天前
kafka·debezium·schema·flink cdc系列·serialization·序列化器·debezium json
Flink CDC系列之:Kafka Debezium JSON 序列化器的实现DebeziumJsonSerializationSchema这是一个 Debezium JSON 序列化器的实现,负责将 Flink CDC 事件转换为标准的 Debezium JSON 格式。
最笨的羊羊18 天前
kafka·flink cdc系列·kafkadata·数据接收器配置选项类·sinkoptions
Flink CDC系列之:Kafka 数据接收器配置选项类KafkaDataSinkOptions这是一个 Kafka 数据接收器配置选项类,定义了 Flink CDC 连接 Kafka Sink 的所有可配置参数。
最笨的羊羊19 天前
kafka·flink cdc系列·数据接收器工厂类·kafkadata·sinkfactory
Flink CDC系列之: Kafka 数据接收器工厂类KafkaDataSinkFactory这是一个 Kafka 数据接收器工厂类,负责创建和配置 Kafka Sink 实例。类概述这个工厂类实现了 Flink CDC 的 DataSinkFactory 接口,专门用于创建 KafkaDataSink 实例。
最笨的羊羊19 天前
partition·flink cdc系列·strategy·枚举类·kafka 分区策略
Flink CDC系列之:Kafka 分区策略枚举类PartitionStrategy这是一个 Kafka分区策略枚举类,定义了如何将 ProducerRecord 分发到 Kafka 的不同分区。
最笨的羊羊19 天前
flink cdc系列·kafka表结构信息·管理类·tableschemainfo
Flink CDC系列之:Kafka表结构信息管理类TableSchemaInfo这是一个 表结构信息管理类,负责维护表结构信息、字段获取器和序列化器,并提供数据转换功能。类概述这个类封装了表的结构信息、序列化器和数据转换逻辑,是 Kafka JSON/CSV 序列化器的核心支撑组件。
最笨的羊羊19 天前
kafka·flink cdc系列·数据接收器实现类·kafkadatasink
Flink CDC系列之: Kafka 数据接收器实现类KafkaDataSink这是一个 Kafka 数据接收器实现类,负责将 CDC 事件发送到 Kafka。类概述这个类实现了 Flink CDC 的 DataSink 接口,是 Kafka 连接器的核心实现。
最笨的羊羊21 天前
doris·flink cdc系列·schemautils·模式工具类
Flink CDC系列之:Doris 模式工具类DorisSchemaUtils这是一个 Doris 模式工具类,专门用于处理 Flink CDC 到 Doris 数据同步时的自动分区配置。
最笨的羊羊21 天前
flink cdc系列·config·flink-cdc-base
Flink CDC系列之:flink-cdc-base模块configflink-cdc-base 模块是 Flink CDC 项目中的核心基础库,它封装了构建变更数据捕获(CDC)连接器所需的通用逻辑、接口和基础组件。
最笨的羊羊21 天前
flink cdc系列·flink-cdc-base·dialect
Flink CDC系列之:flink-cdc-base模块dialect这是一个 数据源方言接口,定义了与不同类型数据库交互的统一抽象层。接口概述方言模式: 为不同数据库提供特定实现
最笨的羊羊22 天前
json·flink cdc系列·serialization·json 序列化器·rowdata·schemautils
Flink CDC系列之:JSON 序列化器JsonRowDataSerializationSchemaUtils这是一个 Flink 版本兼容性工具类,专门用于处理不同 Flink 版本之间 JSON 序列化器的构造函数差异。
最笨的羊羊22 天前
kafka·csv·schema·flink cdc系列·serialization·序列化器
Flink CDC系列之:Kafka CSV 序列化器CsvSerializationSchema这是一个 CSV 序列化器,负责将 Flink CDC 事件转换为 CSV 格式的数据。类概述这个类实现了 Flink 的 SerializationSchema 接口,专门用于将 CDC 事件序列化为 CSV 格式的字节数组。
最笨的羊羊22 天前
kafka·debezium·flink cdc系列·debezium json·结构定义类·jsonstruct
Flink CDC系列之:Kafka的Debezium JSON 结构定义类DebeziumJsonStruct这是一个 Debezium JSON 结构定义类,使用枚举来定义 Debezium JSON 格式的字段结构和位置信息。
最笨的羊羊22 天前
flink cdc系列·kafka json·序列化类型枚举
Flink CDC系列之:Kafka JSON 序列化类型枚举枚举概述这个枚举定义了 Kafka Sink 支持的 JSON 序列化格式类型,主要用于配置选择不同的序列化器实现。
最笨的羊羊23 天前
doris·flink cdc系列·数据接收器工厂类·datasinkfactory
Flink CDC系列之:数据接收器工厂类DorisDataSinkFactory这是一个实现了 DataSinkFactory 接口的工厂类,专门用于创建 Doris 数据库的数据接收器。
最笨的羊羊1 个月前
flink cdc系列·各个模块作用
Flink CDC系列之:Apache Flink CDC 项目的各个模块作用作用: 提供整个项目共享的基础组件和工具类主要包含:作用: CDC 管道执行的核心运行时逻辑关键组件:
最笨的羊羊1 年前
flink cdc系列·学习理解核心概念·data sink
Flink CDC系列之:学习理解核心概念——Data Sink数据接收器用于应用架构更改并将更改数据写入外部系统。数据接收器可以同时写入多个表。为了描述数据接收器,需要以下内容:
最笨的羊羊1 年前
flink cdc系列·data source·学习理解核心概念
Flink CDC系列之:学习理解核心概念——Data Source数据源用于访问元数据并从外部系统读取更改的数据。数据源可以同时从多个表读取数据。要描述数据源,需要以下内容:
最笨的羊羊1 年前
flink cdc系列·学习理解核心概念·data pipeline
Flink CDC系列之:学习理解核心概念——Data Pipeline由于 Flink CDC 中的事件以管道方式从上游流向下游,因此整个 ETL 任务被称为数据管道。管道对应于 Flink 中的一系列操作。