Hive sql执行文件合并配置参数

HIVE自动合并输出的小文件的主要优化手段为:HIVE将会启动一个独立的map-reduce任务进行输出文件的merge。

set hive.merge.mapfiles = true:

在只有map的作业结束时合并小文件,

set hive.merge.mapredfiles = true:

在Map-Reduce的任务结束时合并小文件,默认为False;

set hive.merge.size.per.task = 256000000;

合并后每个文件的大小,默认256M

set hive.merge.smallfiles.avgsize=16000000;

当输出文件的平均大小小于16M时合并。

set hive.merge.orcfile.stripe.level=false;

当设置为true,orc文件进行stripe Level级别的合并,当设置为false,orc文件进行文件级别的合并。

相关推荐
我是一颗柠檬4 小时前
【MySQL全面教学】MySQL基础SQL语句Day3(2026年)
数据库·后端·sql·mysql·oracle
XS0301064 小时前
MyBatis动态SQL
数据库·sql·mybatis
hef2888 小时前
SQL和Python怎么选?数据分析工具实战指南
python·sql·数据分析
顾凌陵8 小时前
SQL注入漏洞进阶篇
网络·sql
ZengLiangYi9 小时前
ChatCrystal大量对话导入时的内存优化
sql·ai编程
Full Stack Developme10 小时前
SQL like 与 正则 区别
数据库·sql·mysql
我是一颗柠檬11 小时前
【MySQL全面教学】MySQL多表查询与JOIN Day6(2026年)
数据库·后端·sql·mysql
r-t-H1 天前
从零开始搭建CDH-第十二章
linux·hive·spark·centos·hbase
网管NO.11 天前
SQL 日期函数全套精讲!时间格式化、日期加减、年月日提取,做日报周报直接套用
数据库·sql
m0_639310791 天前
大数据技术原理-HDFS的安装与应用
java·大数据·jvm·hadoop·spring·hdfs·eclipse