Flink对接Kafka的topic数据消费offset设置参数

scan.startup.mode 是 Flink 中用于设置消费 Kafka topic 数据的起始 offset 的配置参数之一。

scan.startup.mode 可以设置为以下几种模式:

  • earliest-offset:从最早的 offset 开始消费数据。
  • latest-offset:从最新的 offset 开始消费数据。
  • group-offsets:从消费者组的 offset 开始消费数据。
  • timestamp:根据指定的时间戳开始消费数据。
  • specific-offsets:根据指定的 offset 开始消费数据。

在 Flink 的配置文件(如 flink-conf.yaml)中,,可以通过设置以下参数来配置 scan.startup.mode

# 设置启动模式为 earliest-offset
flink.connector.kafka.scan.startup.mode: earliest-offset

或者在程序中使用 FlinkKafkaConsumersetStartupMode() 方法来设置启动模式:

Properties props = new Properties();
props.setProperty("bootstrap.servers", "localhost:9092");
props.setProperty("group.id", "consumer-group");

FlinkKafkaConsumer<String> kafkaConsumer = new FlinkKafkaConsumer<>("topic-name", new SimpleStringSchema(), props);
kafkaConsumer.setStartupMode(StartupMode.EARLIEST);

// 使用 kafkaConsumer 进行后续操作

需要注意的是,scan.startup.mode 参数是用于 Flink 1.14 版本及以上。在更早的版本中,可以使用 flink.consumer.startup-mode 参数来设置消费 Kafka 数据的起始 offset 模式。

相关推荐
陪学28 分钟前
自动驾驶,被逼着上市?
大数据·人工智能·物联网·机器学习·自动驾驶·产品运营·产品经理
大数据深度洞察1 小时前
Hive企业级调优[5]—— HQL语法优化之数据倾斜
大数据·数据仓库·hive·sql
Kika写代码2 小时前
【Linux】【Hadoop】大数据基础实验一
大数据·linux·hadoop
新加坡内哥谈技术3 小时前
微软AI核电计划
大数据·人工智能·语言模型·自然语言处理
科爷出击4 小时前
ElasticSearch学习笔记
大数据·后端
半桶水专家4 小时前
如何安装部署kafka
分布式·kafka
檀越剑指大厂5 小时前
【Elasticsearch系列十九】评分机制详解
大数据·elasticsearch·搜索引擎
武子康5 小时前
大数据-141 - ClickHouse 集群 副本和分片 Zk 的配置 Replicated MergeTree原理详解
java·大数据·clickhouse·flink·spark·scala
Hello.Reader5 小时前
深入解析 Apache Doris架构、应用场景与最佳实践
大数据·架构·数据分析·apache
wangye114226 小时前
大舍传媒:尼日利亚传统新闻媒体宣传助力新兴行业蓬勃发展
大数据·人工智能