Hive sql执行文件合并配置参数

HIVE自动合并输出的小文件的主要优化手段为:HIVE将会启动一个独立的map-reduce任务进行输出文件的merge。

set hive.merge.mapfiles = true:

在只有map的作业结束时合并小文件,

set hive.merge.mapredfiles = true:

在Map-Reduce的任务结束时合并小文件,默认为False;

set hive.merge.size.per.task = 256000000;

合并后每个文件的大小,默认256M

set hive.merge.smallfiles.avgsize=16000000;

当输出文件的平均大小小于16M时合并。

set hive.merge.orcfile.stripe.level=false;

当设置为true,orc文件进行stripe Level级别的合并,当设置为false,orc文件进行文件级别的合并。

相关推荐
淼淼爱喝水1 小时前
DVWA手动盲注SQL实验(详细教程)
数据库·sql·网络安全·oracle·dvwa
FL4m3Y4n12 小时前
MySQL索引原理与SQL优化
android·sql·mysql
落日漫游12 小时前
MySQL约束:6大核心机制详解
sql
不会写DN14 小时前
GORM 实战入门:从环境搭建到企业级常用特性全解析
sql·mysql·go·gin
tumeng071116 小时前
HDFS的架构优势与基本操作
hadoop·hdfs·架构
蓝眸少年CY17 小时前
Hive - 函数、压缩与优化
数据仓库·hive·hadoop
仗剑_走天涯18 小时前
Hadoop 安装
大数据·hadoop·分布式
gjc59219 小时前
如何写好SQL:企业内训文档
数据库·sql
sunxunyong21 小时前
HDFS nnsdy重新配置启动
大数据·hadoop·hdfs