Flink常见面试题整理
文章目录
- Flink常见面试题整理
- [1. 数据倾斜问题怎么解决?](#1. 数据倾斜问题怎么解决?)
- 2、什么是Flink中的窗口
- 3、Flink中的水位线(Watermarks)是什么?
- 4、Flink中的定时器实现机制是什么?有什么作用?
- 5、Flink中的状态和状态后端指的是什么,实现原理是什么?
- 6、Flink中的Checkpoint机制实现原理是什么,有什么作用?
- 7、Flink中的Savepoint机制实现原理是什么,有什么作用,与Checkpoint有什么异同点?
- 8、Flink是如何实现Exactly-Once端到端一致性的?
- 9、Flink内部的一致性保证是默认开启的吗?Checkpoint机制是自动开启的吗,如果不是,要实现Checkpoint机制需要哪些配置?
- 总结
1. 数据倾斜问题怎么解决?
数据倾斜就是数据的分布严重不均,流入部分算子的数据明显多于其他算子,造成这部分算子压力过大,进而拖慢整体数据的处理流程。
数据倾斜问题怎么解决
2、什么是Flink中的窗口
将无限数据流切割成有限的"数据块"进行处理,即为所谓的窗口。
什么是Flink中的窗口
3、Flink中的水位线(Watermarks)是什么?
水位线是一种特殊的逻辑时钟,允许处理乱序事件。它们是衡量事件时间进度的机制,并定义了何时可以触发时间窗口的计算。
Flink中的水位线(Watermarks)是什么
4、Flink中的定时器实现机制是什么?有什么作用?
5、Flink中的状态和状态后端指的是什么,实现原理是什么?
6、Flink中的Checkpoint机制实现原理是什么,有什么作用?
Flink中的Checkpoint机制实现原理是什么,有什么作用?
7、Flink中的Savepoint机制实现原理是什么,有什么作用,与Checkpoint有什么异同点?
Flink中的Checkpoint机制实现原理是什么,有什么作用?
8、Flink是如何实现Exactly-Once端到端一致性的?
Flink是如何实现Exactly-Once端到端一致性的?
9、Flink内部的一致性保证是默认开启的吗?Checkpoint机制是自动开启的吗,如果不是,要实现Checkpoint机制需要哪些配置?
Flink内部的一致性保证是默认开启的吗?Checkpoint机制是自动开启的吗,如果不是,要实现Checkpoint机制需要哪些配置?