Flink对接Kafka的topic数据消费offset设置参数

scan.startup.mode 是 Flink 中用于设置消费 Kafka topic 数据的起始 offset 的配置参数之一。

scan.startup.mode 可以设置为以下几种模式:

  • earliest-offset:从最早的 offset 开始消费数据。
  • latest-offset:从最新的 offset 开始消费数据。
  • group-offsets:从消费者组的 offset 开始消费数据。
  • timestamp:根据指定的时间戳开始消费数据。
  • specific-offsets:根据指定的 offset 开始消费数据。

在 Flink 的配置文件(如 flink-conf.yaml)中,,可以通过设置以下参数来配置 scan.startup.mode

复制代码
# 设置启动模式为 earliest-offset
flink.connector.kafka.scan.startup.mode: earliest-offset

或者在程序中使用 FlinkKafkaConsumersetStartupMode() 方法来设置启动模式:

复制代码
Properties props = new Properties();
props.setProperty("bootstrap.servers", "localhost:9092");
props.setProperty("group.id", "consumer-group");

FlinkKafkaConsumer<String> kafkaConsumer = new FlinkKafkaConsumer<>("topic-name", new SimpleStringSchema(), props);
kafkaConsumer.setStartupMode(StartupMode.EARLIEST);

// 使用 kafkaConsumer 进行后续操作

需要注意的是,scan.startup.mode 参数是用于 Flink 1.14 版本及以上。在更早的版本中,可以使用 flink.consumer.startup-mode 参数来设置消费 Kafka 数据的起始 offset 模式。

相关推荐
Edingbrugh.南空6 小时前
Flink自定义函数
大数据·flink
gaosushexiangji7 小时前
利用sCMOS科学相机测量激光散射强度
大数据·人工智能·数码相机·计算机视觉
CodeWithMe8 小时前
【Note】《Kafka: The Definitive Guide》第四章:Kafka 消费者全面解析:如何从 Kafka 高效读取消息
分布式·kafka
无级程序员10 小时前
大数据平台之ranger与ldap集成,同步用户和组
大数据·hadoop
lifallen11 小时前
Paimon 原子提交实现
java·大数据·数据结构·数据库·后端·算法
TDengine (老段)11 小时前
TDengine 数据库建模最佳实践
大数据·数据库·物联网·时序数据库·tdengine·涛思数据
张先shen11 小时前
Elasticsearch RESTful API入门:全文搜索实战(Java版)
java·大数据·elasticsearch·搜索引擎·全文检索·restful
Elastic 中国社区官方博客11 小时前
Elasticsearch 字符串包含子字符串:高级查询技巧
大数据·数据库·elasticsearch·搜索引擎·全文检索·lucene
张先shen12 小时前
Elasticsearch RESTful API入门:全文搜索实战
java·大数据·elasticsearch·搜索引擎·全文检索·restful
expect7g12 小时前
Flink-Checkpoint-2.OperatorChain
后端·flink