Hive sql执行文件合并配置参数

HIVE自动合并输出的小文件的主要优化手段为:HIVE将会启动一个独立的map-reduce任务进行输出文件的merge。

set hive.merge.mapfiles = true:

在只有map的作业结束时合并小文件,

set hive.merge.mapredfiles = true:

在Map-Reduce的任务结束时合并小文件,默认为False;

set hive.merge.size.per.task = 256000000;

合并后每个文件的大小,默认256M

set hive.merge.smallfiles.avgsize=16000000;

当输出文件的平均大小小于16M时合并。

set hive.merge.orcfile.stripe.level=false;

当设置为true,orc文件进行stripe Level级别的合并,当设置为false,orc文件进行文件级别的合并。

相关推荐
努力进修19 分钟前
复杂查询性能优化:连接条件下推的代价模型设计与实践
数据库·sql·性能优化
yatum_20148 小时前
Hadoop 2.7.3 集群部署、配置与环境变量调优全流程总结
hadoop
青槿吖10 小时前
第二篇:告别XML臃肿配置!Spring注解式IOC/DI保姆级教程,从入门到真香
xml·java·开发语言·数据库·后端·sql·spring
北漂Zachary11 小时前
Mysql中使用sql语句生成雪花算法Id
sql·mysql·算法
2301_8187320614 小时前
运行项目,sql报错无效索引 已解决
数据库·sql
Y0011123615 小时前
Day3-MySQL-SQL-2
数据库·sql·mysql
V1ncent Chen15 小时前
从零学SQL 07 数据过滤
数据库·sql·mysql·数据分析
华科易迅17 小时前
SQL学习
java·sql·学习
程序员花萍雨17 小时前
【SQL 极简速通 1/5】从手动搬砖到声明式“点菜”
sql
TTc_18 小时前
对于子查询语句多条sql报错排查
数据库·sql·mybatis