Hive 任务限制同时运行的任务数量的配置

Hive任务的并发控制,指同时运行的 container 的数量,防止先提交的任务占用全部的队列资源,导致后来提交的任务无法申请到足够的资源。

Hive 任务的并发控制,和使用的引擎相关。

MapReduce(MR)引擎

  • Map 任务

    mr 引擎使用 mapreduce.job.running.map.limit 来限制同时执行的 map 任务数量。如一个 hive 任务生成 1000 个 map 任务。当 mapreduce.job.running.map.limit 为 10 时,最多可以同时运行 10 个 map 任务。默认值为0,代表不限制同时执行的 map 任务数量。

  • Reduce 任务
    mapreduce.job.running.reduce.limit 来限制同时执行的 reduce 任务数量。默认值为0,代表不限制。

Tez 引擎

TEZ 没有相关的配置。

相关推荐
虚幻如影14 小时前
Hive 中“STRING类型无需显式指定长度
数据仓库·hive·hadoop
橘子编程6 天前
Hive大数据实战指南:从入门到精通
大数据·hive·hadoop
橘子编程7 天前
Apache Hadoop知识全解析
大数据·hive·hadoop·apache
dovens7 天前
Spring Boot 从 2.7.x 升级到 3.3注意事项
数据库·hive·spring boot
Joy T9 天前
【大数据】离线数仓核心组件:Hive 架构解析与进阶操作指南
大数据·数据仓库·hive·hadoop·架构
jasnet_u9 天前
在Hadoop3.3.6上搭建Hive3.1.2
hive·hadoop
二进制_博客9 天前
使用Datax批量将mysql数据导入hive
数据库·hive·mysql
talen_hx29610 天前
《零基础入门Spark》学习笔记 Day 10
大数据·hive·笔记·学习·spark
二进制_博客10 天前
Spark On Hive 系统整合
大数据·hive·spark
蓝眸少年CY14 天前
Hive - 函数、压缩与优化
数据仓库·hive·hadoop