Hive sql执行文件合并配置参数

HIVE自动合并输出的小文件的主要优化手段为:HIVE将会启动一个独立的map-reduce任务进行输出文件的merge。

set hive.merge.mapfiles = true:

在只有map的作业结束时合并小文件,

set hive.merge.mapredfiles = true:

在Map-Reduce的任务结束时合并小文件,默认为False;

set hive.merge.size.per.task = 256000000;

合并后每个文件的大小,默认256M

set hive.merge.smallfiles.avgsize=16000000;

当输出文件的平均大小小于16M时合并。

set hive.merge.orcfile.stripe.level=false;

当设置为true,orc文件进行stripe Level级别的合并,当设置为false,orc文件进行文件级别的合并。

相关推荐
linweidong27 分钟前
hive sql行转列,列转行sql的实例
hive·hadoop·sql
只想早点退休的90后28 分钟前
sql面试题分享
数据库·sql
Apache Flink1 小时前
克服Flink SQL限制的混合API方法
大数据·sql·flink
Hello.Reader1 小时前
Flink SQL 性能调优MiniBatch、两阶段聚合、Distinct 拆分、MultiJoin 与 Delta Join 一文打通
sql·spring·flink
实泽有之,无泽虚之15 小时前
MySQL主机因多次连接数据库错误而被阻塞
数据库·sql·mysql
Knight_AL16 小时前
从自然语言到 SQL:为什么向量数据库是更好的选择
数据库·sql
amao998818 小时前
数据库原理与技术 - 3-7 视图和索引 View& Index
数据库·sql·oracle
柒.梧.20 小时前
从原理到实战:Spring AOP全解析
数据库·sql
山峰哥20 小时前
SQL优化中的索引策略与Explain分析实战
大数据·汇编·数据库·sql·编辑器
小鸡脚来咯21 小时前
MySQL索引优化
sql·mysql