Flink对接Kafka的topic数据消费offset设置参数

scan.startup.mode 是 Flink 中用于设置消费 Kafka topic 数据的起始 offset 的配置参数之一。

scan.startup.mode 可以设置为以下几种模式:

  • earliest-offset:从最早的 offset 开始消费数据。
  • latest-offset:从最新的 offset 开始消费数据。
  • group-offsets:从消费者组的 offset 开始消费数据。
  • timestamp:根据指定的时间戳开始消费数据。
  • specific-offsets:根据指定的 offset 开始消费数据。

在 Flink 的配置文件(如 flink-conf.yaml)中,,可以通过设置以下参数来配置 scan.startup.mode

复制代码
# 设置启动模式为 earliest-offset
flink.connector.kafka.scan.startup.mode: earliest-offset

或者在程序中使用 FlinkKafkaConsumersetStartupMode() 方法来设置启动模式:

复制代码
Properties props = new Properties();
props.setProperty("bootstrap.servers", "localhost:9092");
props.setProperty("group.id", "consumer-group");

FlinkKafkaConsumer<String> kafkaConsumer = new FlinkKafkaConsumer<>("topic-name", new SimpleStringSchema(), props);
kafkaConsumer.setStartupMode(StartupMode.EARLIEST);

// 使用 kafkaConsumer 进行后续操作

需要注意的是,scan.startup.mode 参数是用于 Flink 1.14 版本及以上。在更早的版本中,可以使用 flink.consumer.startup-mode 参数来设置消费 Kafka 数据的起始 offset 模式。

相关推荐
武子康20 分钟前
大数据-200 决策树信息增益详解:信息熵、ID3 选特征与 Python 最佳切分实现
大数据·后端·机器学习
小王毕业啦42 分钟前
2000-2023年 上市公司-企业组织惯性数据
大数据·人工智能·数据挖掘·数据分析·数据统计·社科数据·实证数据
左灯右行的爱情2 小时前
Kafka专辑 : 生产者写入路径
分布式·kafka·linq
小北方城市网2 小时前
第 3 课:前后端全栈联动核心 —— 接口规范 + AJAX + 跨域解决(打通前后端壁垒)
java·大数据·网络·python
数智顾问2 小时前
(111页PPT)华为业务变革框架及战略级项目管理(附下载方式)
大数据·运维·华为
微光闪现3 小时前
国际航班动态提醒与延误预测优选平台指南
大数据·人工智能·算法
week_泽3 小时前
github_upload,上传项目
大数据·elasticsearch·github
左灯右行的爱情3 小时前
Kafka专辑: 日志存储模型
分布式·kafka·linq
LB21124 小时前
Kafka笔记
分布式·kafka·linq
TDengine (老段)4 小时前
TDengine 生态系统连接指南
大数据·数据库·物联网·时序数据库·iot·tdengine·涛思数据