Hive sql执行文件合并配置参数

HIVE自动合并输出的小文件的主要优化手段为:HIVE将会启动一个独立的map-reduce任务进行输出文件的merge。

set hive.merge.mapfiles = true:

在只有map的作业结束时合并小文件,

set hive.merge.mapredfiles = true:

在Map-Reduce的任务结束时合并小文件,默认为False;

set hive.merge.size.per.task = 256000000;

合并后每个文件的大小,默认256M

set hive.merge.smallfiles.avgsize=16000000;

当输出文件的平均大小小于16M时合并。

set hive.merge.orcfile.stripe.level=false;

当设置为true,orc文件进行stripe Level级别的合并,当设置为false,orc文件进行文件级别的合并。

相关推荐
M***Z2101 小时前
SQL 建表语句详解
java·数据库·sql
b***59432 小时前
MySQL数据库(SQL分类)
数据库·sql·mysql
i***27952 小时前
MySQL 常用 SQL 语句大全
数据库·sql·mysql
IndulgeCui2 小时前
KingbaseES 数据库与用户默认表空间深度解析
数据库·sql·mysql
v***91302 小时前
DVWA靶场通关——SQL Injection篇
数据库·sql
学c菜鸟鸟3 小时前
漏洞知识——sql注入(二)
数据库·sql·oracle
P***84393 小时前
SQL多行数据合并到一行中的一个字段
数据库·sql
L***86534 小时前
SQL 注入详解:原理、危害与防范措施
数据库·sql·oracle
8***J1824 小时前
SQL进阶——JOIN操作详解
数据库·sql·oracle
i***27955 小时前
Oracle分页sql
数据库·sql·oracle