Hive 任务限制同时运行的任务数量的配置

Hive任务的并发控制,指同时运行的 container 的数量,防止先提交的任务占用全部的队列资源,导致后来提交的任务无法申请到足够的资源。

Hive 任务的并发控制,和使用的引擎相关。

MapReduce(MR)引擎

  • Map 任务

    mr 引擎使用 mapreduce.job.running.map.limit 来限制同时执行的 map 任务数量。如一个 hive 任务生成 1000 个 map 任务。当 mapreduce.job.running.map.limit 为 10 时,最多可以同时运行 10 个 map 任务。默认值为0,代表不限制同时执行的 map 任务数量。

  • Reduce 任务
    mapreduce.job.running.reduce.limit 来限制同时执行的 reduce 任务数量。默认值为0,代表不限制。

Tez 引擎

TEZ 没有相关的配置。

相关推荐
社恐码农6 小时前
Hive开窗函数的进阶SQL案例
hive·hadoop·sql
冬至喵喵1 天前
【hive】函数集锦:窗口函数、列转行、日期函数
大数据·数据仓库·hive·hadoop
weixin_472339462 天前
Doris查询Hive数据:实现高效跨数据源分析的实践指南
数据仓库·hive·hadoop
神奇侠20243 天前
Hive SQL常见操作
hive·hadoop·sql
itachi-uchiha3 天前
Docker部署Hive大数据组件
大数据·hive·docker
viperrrrrrrrrr73 天前
大数据学习(131)-Hive数据分析函数总结
大数据·hive·学习
qq_408413393 天前
spark 执行 hive sql数据丢失
hive·sql·spark
yt948324 天前
如何在IDE中通过Spark操作Hive
ide·hive·spark
viperrrrrrrrrr75 天前
大数据学习(129)-Hive数据分析
大数据·hive·学习
伍六星5 天前
图片上传问题解决方案与实践
大数据·hive·hadoop