Flink并行度

1、Task

flink中每个算子就是一个Task,比如flatMap、map、sum是一个Task。

2、SubTask

算子有几个并行度SubTask的数量就是几,比如

3、算子并行度

算子并行度指的是每个算子的并行度,可用env.setParallelism(1);设置所有算子的并行度,也可以对每个算子单独设置,通过降数据流划分为多个并行的算子实例(SubTask)可实现数据的并行处理。

一个Job的并行度是算子并行度的最大值,比如一个Job中有map算子并行度是2、filter算子并行度是4,则任务并行度就是4。

总结:Flink中,每一个算子都可以成为一个独立任务(task)。

相关推荐
heimeiyingwang18 分钟前
从 0 到 1:企业 AI 战略规划与落地路线图
大数据·人工智能
海兰26 分钟前
Elasticsearch 9.3.0 日志数据源配置
大数据·elasticsearch·jenkins
之歆35 分钟前
Hadoop MapReduce 详解
大数据·hadoop·mapreduce
W1333090890741 分钟前
2026 大专大数据与会计专业考证书门槛低的有哪些?
大数据
geneculture1 小时前
智慧系统工程实践:从人机互助至人机协同
大数据·人工智能·机器学习·知识图谱·融智学的重要应用·哲学与科学统一性·融智时代(杂志)
是做服装的同学2 小时前
服装企业系统ERP是什么?其主要功能和优势有哪些?
大数据·经验分享·其他
AI周红伟2 小时前
周红伟:企业大模型微调和部署, DeepSeek-OCR v2技术原理和架构,部署案例实操。RAG+Agent智能体构建
大数据·人工智能·大模型·ocr·智能体·seedance
零售ERP菜鸟2 小时前
数据驱动:从经验主义的“后视镜”到科学决策的“导航仪”
大数据·人工智能·职场和发展·创业创新·学习方法·业界资讯
紫微AI2 小时前
站在奇点门槛上:风投转向、Agent爆发与AI时代的生存逻辑
大数据·人工智能