Hive 任务限制同时运行的任务数量的配置

Hive任务的并发控制,指同时运行的 container 的数量,防止先提交的任务占用全部的队列资源,导致后来提交的任务无法申请到足够的资源。

Hive 任务的并发控制,和使用的引擎相关。

MapReduce(MR)引擎

  • Map 任务

    mr 引擎使用 mapreduce.job.running.map.limit 来限制同时执行的 map 任务数量。如一个 hive 任务生成 1000 个 map 任务。当 mapreduce.job.running.map.limit 为 10 时,最多可以同时运行 10 个 map 任务。默认值为0,代表不限制同时执行的 map 任务数量。

  • Reduce 任务
    mapreduce.job.running.reduce.limit 来限制同时执行的 reduce 任务数量。默认值为0,代表不限制。

Tez 引擎

TEZ 没有相关的配置。

相关推荐
小湘西1 小时前
在 Hive 中NULL的理解
数据仓库·hive·hadoop
jiuweiC21 小时前
hive常用命令
hive
hweiyu001 天前
Hive 技术深度解析与 P7 数据分析架构师多行业全场景实战课程合集(视频教程)
hive·数据分析
笨蛋少年派2 天前
Hive安装部署
数据仓库·hive·hadoop
yumgpkpm3 天前
CMP(类ClouderaCDP7.3(404次编译) )完全支持华为鲲鹏Aarch64(ARM)使用 AI 优化库存水平、配送路线的具体案例及说明
大数据·人工智能·hive·hadoop·机器学习·zookeeper·cloudera
梦里不知身是客115 天前
hive的全连接
hive
Kay_Liang5 天前
【Hive 踩坑实录】从元数据库初始化到 HiveServer2 启动的全流程问题解决
大数据·linux·hive·hadoop·笔记·mysql·ubuntu
2501_938773996 天前
大数据离线处理:使用 Airflow 调度 Hive 脚本的工作流设计
大数据·hive·hadoop
Timer_Cooker6 天前
Hive 分区表变更字段长度不生效
数据仓库·hive·hadoop
2501_938782096 天前
《Ubuntu 系统下 MySQL 安装前的环境检查与依赖准备指南》
hive·mysql·ubuntu·adb