flinksql实时统计程序背压延迟优化

问题:

复制代码
flinkcdc+flinksql做实时读取sls日志和实时统计业务指标,今天发现程序背压了,业务延迟了6个小时。

解决办法:

复制代码
1、资源优化
作业并发大时:在作业的高级配置的资源配置中,增加JobManager的资源,提高CPU和内存的大小,例如:Job Manager cpu设置为4。Job Manager Memory设置为8 GiB。
作业拓扑较复杂时,在作业的高级配置的资源配置中,增加TaskManager的资源,提高CPU和内存的大小,例如:Task Manager CPUs设置为4。Task Manager Memory设置为8 GiB。
2、sql优化
开启MiniBatch(提升吞吐):
table.exec.mini-batch.enabled: true
table.exec.mini-batch.allow-latency: 5s
MiniBatch是缓存一定的数据后再触发处理,以减少对State的访问,从而提升吞吐并减少数据的输出量。MiniBatch主要基于事件消息来触发微批处理,事件消息会按您指定的时间间隔在源头插入。

复盘

下面是实时延迟时的截图:

下面是实时追上数据时的截图:

bingo:我开启了MiniBatch配置,以5秒微批的方式做实时处理,程序性能直接飞速提升,6小时的延迟十几分钟就追上了。性能杠杠的!

相关推荐
宝哥大数据20 小时前
Flink内存模型--flink1.19.1
大数据·flink
路由侠内网穿透1 天前
本地部署开源流处理框架 Apache Flink 并实现外部访问
大数据·网络协议·tcp/ip·flink·服务发现·apache·consul
宝哥大数据1 天前
Flinksql--订单宽表
大数据·flink
Florian2 天前
Graph4Stream:基于图的流计算加速
flink·流计算·图计算·geaflow
宝哥大数据2 天前
flink 分组窗口聚合 与 窗口表值函数聚合 的区别
flink
張萠飛3 天前
Flink在双流Join中,window如何选择
大数据·flink
黄雪超4 天前
Flink介绍——实时计算核心论文之S4论文详解
大数据·论文阅读·flink
Flink_China4 天前
Flink 批处理自适应执行计划优化
flink
宝哥大数据4 天前
flink 基站与服务器长连接,每次连接和断开都会上报数据,统计过去一小时每个基站断开次数和时长
大数据·服务器·flink
十六ᵛᵃᵉ5 天前
day1_Flink基础
大数据·flink