Flink SQL 支持 kafka 开启 kerberos 权限控制.

一. 背景.

最近在验证kafka 开启kerberos的情况下, flink任务的支持情况.
但是验证的时候发现一个互斥的情况. 在读取数据的时候, 在开启kafka gruop id的权限控制的时候, flink sql 即使设置了gruop id , 竟然还能读取数据.

这个和预期不符. 所以才较真验证了一下.

二. kafka消费topic数据姿势

消费kafka的数据的时候首先要构造KafkaConsumer客户端, 然后KafkaConsumer客户端有两种方式读取topic 中的数据.

  • 使用 subscribe 是最常见的,因为它支持动态分区再均衡和消费者组的管理,适合多数场景。
  • 使用 assign 适合需要精确控制分区消费的特定场景,但不支持自动再均衡,因此需要开发者手动管理分区分配和调整。

2.1. subscribe 方法

  1. 目的:主要用于订阅一个或多个主题。消费者会自动分配这些主题的分区。

  2. 使用场景:适合使用消费者组(Consumer Group)的场景。Kafka 会自动进行分区的再均衡(rebalancing),确保同一消费者组内不会有多个消费者消费同一分区。

  3. 自动分配:使用 subscribe 时,Kafka 会自动为消费者分配它所订阅主题下的分区。

  4. 再均衡监听器:可以通过实现 ConsumerRebalanceListener 接口来自定义在分区再均衡时的行为。

  5. 动态性:如果新的分区被添加到主题中,消费者将自动开始消费新的分区。

  6. API 示例:

    java 复制代码
    List<String> topics = Arrays.asList("topic1", "topic2");
    consumer.subscribe(topics);

2.2. assign 方法

  1. 目的:用于手动分配消费者要消费的具体分区。

  2. 使用场景:适合需要对某些特定分区进行精确控制的场景。例如,需要单独处理特定分区时。

  3. 手动分配:通过 assign 方法,开发者显式指定消费者应该消费哪些分区。

  4. 无再均衡:使用 assign 时,Kafka 不会执行分区再均衡。消费者组的概念在这种模式下不适用。

  5. 静态性:如果主题增加了新的分区,消费者不会自动开始消费这些新分区,除非显式地调用 assign 方法来分配新的分区。

  6. API 示例:

    java 复制代码
    List<TopicPartition> partitions = Arrays.asList(new TopicPartition("topic1", 0), new TopicPartition("topic1", 1));
    consumer.assign(partitions);

三. 使用java client 验证.

3.1. 总结

  1. 无论subscribe 和assign 都需要授权topic .
  2. subscribe 方法需要指定group id , 所以需要group id 授权.
  3. assign 方法 group id 不是必填项, 不指定group id 的时候, group id 不生效, 指定了之后group id , 权限控制就会生效.

3.2. subscribe 方法

java 复制代码
        
        
    public static void main(String[] args) {
        System.setProperty("java.security.krb5.conf", "tmp/krb5.conf");

        Properties props = new Properties();
        // group.id,指定了消费者所属群组
        props.put("bootstrap.servers", "master01:9092");
        props.put("key.deserializer", "org.apache.kafka.common.serialization.StringDeserializer");
        props.put("value.deserializer", "org.apache.kafka.common.serialization.StringDeserializer");
        props.put("group.id", "kafka-group-01");
        props.put("auto.offset.reset","earliest");
        props.put("security.protocol", "SASL_PLAINTEXT");
        props.put("sasl.mechanism", "GSSAPI");
        props.put("sasl.jaas.config", "com.sun.security.auth.module.Krb5LoginModule required " +
                "useKeyTab=true " +
                "keyTab=\"/opt/iceberg/gydev_easyops-cluster/sloth.keytab\" " +
                "storeKey=true " +
                "useTicketCache=false " +
                "serviceName=\"kafka\" " +
                "principal=\"sloth/ALL@BDMS.COM\";");


        KafkaConsumer<String, String> consumer = new KafkaConsumer<String, String>(props);
        consumer.subscribe(Collections.singletonList("sloth-validate-01"));
        
        ConsumerRecords<String, String> records = consumer.poll(Duration.ofSeconds(5));
        for (ConsumerRecord<String, String> record : records) {
            LOG.info("KafkaConsumerDemoSubscribe#ConsumerRecord  -> KEY : {} , VALUE : {} ", record.key(),record.value());
         }

    }
    

3.3. assign 方法示例

java 复制代码
    public static void main(String[] args) {
        System.setProperty("java.security.krb5.conf", "tmp/krb5.conf");

        Properties props = new Properties();
        // group.id,指定了消费者所属群组
        props.put("bootstrap.servers", "easydata-dev13.gy.ntes:9092,easydata-dev14.gy.ntes:9092,easydata-dev12.gy.ntes:9092");
        props.put("key.deserializer", "org.apache.kafka.common.serialization.StringDeserializer");
        props.put("value.deserializer", "org.apache.kafka.common.serialization.StringDeserializer");
//        props.put("group.id", "sloth");
        props.put("auto.offset.reset","earliest");
        props.put("security.protocol", "SASL_PLAINTEXT");
        props.put("sasl.mechanism", "GSSAPI");
        props.put("sasl.jaas.config", "com.sun.security.auth.module.Krb5LoginModule required " +
                "useKeyTab=true " +
                "keyTab=\"/opt/iceberg/gydev_easyops-cluster/sloth.keytab\" " +
                "storeKey=true " +
                "useTicketCache=false " +
                "serviceName=\"kafka\" " +
                "principal=\"sloth/ALL@BDMS.COM\";");

        KafkaConsumer<String, String> consumer = new KafkaConsumer<String, String>(props);

        String topic = "sloth-validate-01";
        topic= "sloth_kerberos";
        consumer.assign(Arrays.asList(new TopicPartition(topic, 0), new TopicPartition(topic, 1), new TopicPartition(topic, 2)));
        ConsumerRecords<String, String> records = consumer.poll(Duration.ofSeconds(5));

        for (ConsumerRecord<String, String> record : records) {
             LOG.info("KafkaConsumerDemoAssign#ConsumerRecord  -> KEY : {} , VALUE : {} ", record.key(),record.value());
         }
         
    }

flink 官方文档:

FLINK 使用assign构建KafkaConsumer , scan.startup.mode 配置项决定了 Kafka consumer 的启动模式。

序号 参数 含义 kafka gruop id 是否必填
1 group-offsets (默认) 从 Zookeeper/Kafka 中某个指定的消费组已提交的偏移量开始。
2 earliest-offset 从可能的最早偏移量开始
3 latest-offset 从最末尾偏移量开始
4 timestamp 从用户为每个 partition 指定的时间戳开始
4 specific-offsets 从用户为每个 partition 指定的偏移量开始
  • 只有使用scan.startup.mode group-offsets flink任务运行的时候才会报gruop id 相关的权限异常.

异常信息:

Caused by: org.apache.kafka.common.errors.GroupAuthorizationException: Not authorized to access group: kafka-validate-group-xx

相关推荐
本体智能8 小时前
预制指标、宽表、SQL、本体ABC:真正决定长期成本的,是一次变更会波及多少层
数据库·sql·本体神经网络·uino数据智能引擎
淼淼爱喝水12 小时前
DVWA SQL 注入(Medium/High 级别)过滤绕过与防范实验(超详细图文版)
数据库·sql·网络安全
zs宝来了14 小时前
Kafka 存储原理:索引文件与日志段管理
kafka·存储·索引·源码解析·日志段
野生技术架构师15 小时前
掌握SQL窗口函数,轻松处理复杂数据分析
数据库·sql·数据分析
admin and root16 小时前
从资产收集FUZZ接口到SQL注入案例
网络·数据库·sql·安全·web安全·渗透测试·log4j
小陈工16 小时前
Python Web开发入门(十):数据库迁移与版本管理——让数据库变更可控可回滚
前端·数据库·人工智能·python·sql·云原生·架构
辣机小司18 小时前
【生产级 Kafka (KRaft) 双中心容灾演练:MirrorMaker 2.0 (MM2) 核心参数配置与回切踩坑指南】
分布式·kafka·集群同步·kafka双集群
xcLeigh20 小时前
IoTDB AINode 实战指南:SQL 原生时序 AI 建模,毫秒级预测 / 异常检测落地
人工智能·sql·ai·iotdb·ainode
乐之者v21 小时前
统计数据时,sql执行超时,如何处理
服务器·数据库·sql
电商API&Tina21 小时前
【京东item_getAPI 】高稳定:API 、非爬虫、不封号、不掉线、大促稳跑
大数据·网络·人工智能·爬虫·python·sql·json