Flink并行度

1、Task

flink中每个算子就是一个Task,比如flatMap、map、sum是一个Task。

2、SubTask

算子有几个并行度SubTask的数量就是几,比如

3、算子并行度

算子并行度指的是每个算子的并行度,可用env.setParallelism(1);设置所有算子的并行度,也可以对每个算子单独设置,通过降数据流划分为多个并行的算子实例(SubTask)可实现数据的并行处理。

一个Job的并行度是算子并行度的最大值,比如一个Job中有map算子并行度是2、filter算子并行度是4,则任务并行度就是4。

总结:Flink中,每一个算子都可以成为一个独立任务(task)。

相关推荐
virtual_k1smet7 小时前
梧桐·鸿鹄- 大数据assistant-level
大数据·笔记
ggabb7 小时前
海南封关:锚定中国制造2025,破解产业转移生死局
大数据·人工智能
aigcapi10 小时前
[深度观察] RAG 架构重塑流量分发:2025 年 GEO 优化技术路径与头部服务商选型指南
大数据·人工智能·架构
山峰哥10 小时前
SQL调优核心战法——索引失效场景与Explain深度解析
大数据·汇编·数据库·sql·编辑器·深度优先
hqyjzsb12 小时前
从爱好到专业:AI初学者如何跨越CAIE认证的理想与现实鸿沟
大数据·c语言·人工智能·信息可视化·职场和发展·excel·业界资讯
Hello.Reader12 小时前
Flink ML KNN 入门基于 Table API 的近邻分类
机器学习·分类·flink
袋鼠云数栈13 小时前
企业数据资产管理核心框架:L1-L5分层架构解析
大数据·人工智能·架构
zxsz_com_cn13 小时前
设备预测性维护怎么做?预测性维护案例详解
大数据·人工智能
G皮T13 小时前
【Elasticsearch】查询性能调优(四):计数的精确性探讨
大数据·elasticsearch·搜索引擎·全文检索·es·性能·opensearch
十月南城13 小时前
ES性能与可用性——分片、副本、路由与聚合的调度逻辑与成本
大数据·elasticsearch·搜索引擎