9、Flink 流式概念之状态化更新与演化详解

表程序在流模式下执行将被视为标准查询,即它们被定义一次后将被一直视为静态的端到端 (end-to-end) 管道。

对于这种状态化的管道,对查询和Flink的Planner的改动都有可能导致完全不同的执行计划,这让表程序的状态化的升级和演化在目前而言仍具有挑战,社区正致力于改进这一缺点。

例如为了添加过滤谓词,优化器可能决定重排 join 或改变内部算子的 schema,这会阻碍从 savepoint 的恢复,因为其被改变的拓扑和 算子状态的列布局差异。

查询实现者需要确保改变在优化计划前后是兼容的,在 SQL 中使用 EXPLAIN 或在 Table API 中使用 table.explain() 可获取详情。

由于新的优化器规则正不断地被添加,算子变得更加高效和专用,升级到更新的 Flink 版本可能造成不兼容的计划。

当前框架无法保证状态可以从 savepoint 映射到新的算子拓扑上,Savepoint 只在查询语句和版本保持恒定的情况下被支持。

相关推荐
科技小花9 小时前
全球数据治理:合规与AI双引擎驱动
大数据·人工智能·数据治理·数据中台
liana87449 小时前
即时通讯IM:从聊天工具到企业数字底座
大数据
WL_Aurora9 小时前
Hadoop HA高可用架构深度解析
大数据·hadoop·架构
清平乐的技术专栏9 小时前
【Flink学习】(六)Flink 三大时间语义 + 水位线 Watermark
大数据·学习·flink
清平乐的技术专栏9 小时前
【Flink学习】(一)初识 Flink,大数据实时计算核心认知
大数据·flink
武子康9 小时前
Java-221 RocketMQ 消息存储核心原理:CommitLog、ConsumerQueue、IndexFile 与消息过滤机制
java·大数据·分布式·消息队列·rabbitmq·rocketmq·java-rocketmq
2601_959477919 小时前
Vatee:数字化能力升级的全面观察
大数据·人工智能
赴山海bi9 小时前
DeepBI赋能:家居类亚马逊Listing优化全攻略
大数据·人工智能
qq_366032789 小时前
Claude API中转怎么选?简易api下的国内接入与兼容 OpenAI 接口实践
大数据·运维·人工智能