Flink并行度

1、Task

flink中每个算子就是一个Task,比如flatMap、map、sum是一个Task。

2、SubTask

算子有几个并行度SubTask的数量就是几,比如

3、算子并行度

算子并行度指的是每个算子的并行度,可用env.setParallelism(1);设置所有算子的并行度,也可以对每个算子单独设置,通过降数据流划分为多个并行的算子实例(SubTask)可实现数据的并行处理。

一个Job的并行度是算子并行度的最大值,比如一个Job中有map算子并行度是2、filter算子并行度是4,则任务并行度就是4。

总结:Flink中,每一个算子都可以成为一个独立任务(task)。

相关推荐
ctrigger9 小时前
电压反馈、电流反馈、串联反馈、并联反馈怎么判断?
大数据
m0_466525299 小时前
锚定场景深耕数据 东软探索城市全域数字化新路径
大数据·人工智能
莫逸风10 小时前
【AgentScope】HarnessAgent 学习指南
大数据·人工智能
武子康10 小时前
调查研究-153 Cloudflare 能部署网站吗?2026 年完整对比 Vercel / Netlify / 自建服务器
大数据·运维·服务器·人工智能·部署·devops·opc
Zldaisy3d10 小时前
物理测试不是唯一方式!增材制造零部件认证路径正在悄悄改变
大数据·服务器·制造
志栋智能11 小时前
超自动化安全:构建智能安全运营的神经系统
大数据·运维·网络·人工智能·安全·自动化
2601_9599862411 小时前
M4Markets:把信息透明度做到位——路径分析与提示整理
大数据·人工智能
追巨12 小时前
单节点elasticsearch安装笔记
大数据·elasticsearch·jenkins
夜郎king12 小时前
告别低效单篇创作,CSDN AI 批量生成工具深度体验
大数据·人工智能·csdn ai 数字营销
鱼锦0.012 小时前
Coreseek和Elasticsearch 有什么区别
大数据·elasticsearch·jenkins