消费数据积压

生产者生产数据的速度超过消费者处理数据的速度,会造成kafka中积压大量未处理的数据

2-1 使用Kafka Eagle查看消费积压

Kafka Eagle是一个用于监控和管理kafka的开源组件,可以同时监控多个kafka集群,

通过Kafka Eagle可以看到当前的消费者组,对于每个组,他们正在使用的主题以及该组在每个主题中的偏移量,消费积压等等
JMX(Java Management Extensions,即 Java 管理扩展)是一个为应用程序、设备、系统等植入管理功能的框架。

它提供了对Java应用程序和JVM的监控和管理功能。通过JMX,我们可以监控服务器中的各种资源的使用情况,CPU、内存,JVM内存的使用情况.

安装kafka-eagle 参考安装文件,只需要在一台服务器上安装即可,版本是1.4.6

  • 启动服务
sh 复制代码
ke.sh start
  • 测试数据写入
python 复制代码
kafka-producer-perf-test.sh --topic user --num-records 1000000 --throughput -1 --record-size 1024 --producer-props bootstrap.servers=node1.itcast.cn:9092,node2.itcast.cn:9092,node3.itcast.cn:9092
  • 限流
    • 限制数据的写入速度
    • 写入速度的限制要根据实际情况调整
sh 复制代码
kafka-configs.sh --zookeeper node1.itcast.cn:2181 --alter --add-config 'producer_byte_rate=1048576' --entity-type clients --entity-default
相关推荐
大大大大晴天19 小时前
Hudi生产问题排障-insert overwrite 路径不存在
大数据·spark
Light6020 小时前
SPARK View:从“AI手工作坊”到“软件工业革命
大数据·人工智能·spark
潘达斯奈基~1 天前
Spark踩坑:如何优化pandas_udf中的多维数组传输效率
大数据·spark·pandas
最初的↘那颗心2 天前
Spark Job 调度机制拆解:从 Action 算子到 Task 执行
大数据·spark·分布式计算
尋有緣2 天前
Spark SQL 调优
大数据·sql·spark
十月南城3 天前
实时数据平台的价值链——数据采集、加工、存储、查询与消费的协同效应与ROI评估
数据库·数据仓库·hive·hadoop·spark
伟大的大威3 天前
NVIDIA DGX Spark (Blackwell GB10) 双机 196B Step 3.5 Flash 大模型部署完整实录
分布式·spark·nvidia
petrel20154 天前
【Spark】深度魔改 Spark 源码:打破静态限制,实现真正的运行时动态扩缩容
大数据·分布式·spark
zml.~5 天前
Spark 大数据分析:从原理到实战的一站式指南
大数据·数据分析·spark
zml.~5 天前
Spark大数据分析:解锁海量数据价值的核心利器
大数据·数据分析·spark