面试篇Flink

宇智波云2023-12-06 21:31

一：为什么学习flink？

相比较spark，flink对于实时这块，使用过流的方式进行实现。

spark是通过批流的方式实现，通过减少批的时间间隔来实现流的功能。

二：什么是flink？

flink是一个针对于实时进行处理的框架。高可用，低延迟。

三：flink怎么使用？

1. flink的俩种架构模式。

Standalone模式。

JobManager

1.将程序转为物理执行图。
1. 申请资源。
2. 监控taskmanager运行情况和checkpoint的协调。
ResourceManager

资源管理器主要负责管理任务管理器（TaskManager）的插槽（slot）。
TaskManager

执行任务
Dispatcher

Flink on yarn模式。

2. TaskSlot与Parallelism。

slot是指taskmanager的并发执行能力。

parallelism是指taskmanager实际使用的并发能力

3. flink 窗口，时间，水位线。

窗口

滚动
滑动
累加

时间

事件时间。
处理时间。
摄入时间。

水位线

4. 状态。

source端保证。
在kafka的源头，我们有偏移量，当重跑的时候，会找到上次的offest进行重新加载数据。
中间进行保证。
checkpoint
savepoint
当jobmanager发送任务的时候，会伴随发送一个barriers（栅栏），每一个操作都会进行一次拍照，最后sink。跑完会将数据存储起来。完成一次保存。最后通知jobmanager。
存储的方式
1. 内存
2. 磁盘
3. 数据库
sink端进行保证。
俩阶段提交。

上一篇：双因素认证（2FA）原理介绍及实现

下一篇：C# 使用 Fody 监控方法执行时间

热门推荐

01GitHub 镜像站点 02如何新建文件夹？电脑新建文件夹的4种方法 032026年7月AI圈大地震：GPT-5.6被政府限制、Claude入驻Slack、Anthropic自研芯片 04国内可直接用、免费额度/永久免费的大模型API清单（含 SiliconFlow、火山、阿里、智谱、百度、Kimi、DeepSeek、DMXAPI 等）05AI科技热点日报 | 2026年07月01日 062026 国产 AI 大模型横评：DeepSeek、通义千问、Kimi、文心一言、星火、豆包谁更能打？07AI 编程 IDE 全景解析 2026：Agent 全面接管开发链路 08微信历史版本含下载地址（ Windows PC | 安卓 | MAC ）及设置微信不更新 09Agnes AI 免费 API 接入指南：文本、生图、生视频，一套接口全免费 10幻兽帕鲁 - 服务器管理员权限与 GM 命令完全指南