Hive sql执行文件合并配置参数

HIVE自动合并输出的小文件的主要优化手段为:HIVE将会启动一个独立的map-reduce任务进行输出文件的merge。

set hive.merge.mapfiles = true:

在只有map的作业结束时合并小文件,

set hive.merge.mapredfiles = true:

在Map-Reduce的任务结束时合并小文件,默认为False;

set hive.merge.size.per.task = 256000000;

合并后每个文件的大小,默认256M

set hive.merge.smallfiles.avgsize=16000000;

当输出文件的平均大小小于16M时合并。

set hive.merge.orcfile.stripe.level=false;

当设置为true,orc文件进行stripe Level级别的合并,当设置为false,orc文件进行文件级别的合并。

相关推荐
Irene19912 小时前
SQL 中日期的特殊性总结(格式符严格要求全大写)
sql
花椒技术3 小时前
从区间锁到行锁:一次高并发写入死锁治理实战
后端·sql
坚持就完事了3 小时前
Hadoop实战初步学习
hadoop·学习
It's Q9 小时前
hive学习分区&&函数
hive·hadoop·学习
你觉得脆皮鸡好吃吗9 小时前
SQL注入 高权限注入(引入概念)
网络·数据库·sql·oracle·网络安全学习
untE EADO9 小时前
MySQL错误-this is incompatible with sql_mode=only_full_group_by完美解决方案
android·sql·mysql
Irene199110 小时前
(课堂笔记)SQL基础语法分类总结表
数据库·sql
你觉得脆皮鸡好吃吗10 小时前
SQL注入 手工注入
网络·数据库·sql·安全·web安全·网络安全学习
m0_7375393710 小时前
SQL语言续2
数据库·sql
隐于花海,等待花开11 小时前
5.TRIM / LTRIM / RTRIM 函数深度解析
大数据·hive