Hive sql执行文件合并配置参数

HIVE自动合并输出的小文件的主要优化手段为:HIVE将会启动一个独立的map-reduce任务进行输出文件的merge。

set hive.merge.mapfiles = true:

在只有map的作业结束时合并小文件,

set hive.merge.mapredfiles = true:

在Map-Reduce的任务结束时合并小文件,默认为False;

set hive.merge.size.per.task = 256000000;

合并后每个文件的大小,默认256M

set hive.merge.smallfiles.avgsize=16000000;

当输出文件的平均大小小于16M时合并。

set hive.merge.orcfile.stripe.level=false;

当设置为true,orc文件进行stripe Level级别的合并,当设置为false,orc文件进行文件级别的合并。

相关推荐
Rverdoser7 小时前
【SQL】多表查询案例
数据库·sql
敲敲敲-敲代码8 小时前
【SQL实验】触发器
数据库·笔记·sql
和道一文字yyds8 小时前
MySQL 中的索引数量是否越多越好?为什么?如何使用 MySQL 的 EXPLAIN 语句进行查询分析?MySQL 中如何进行 SQL 调优?
数据库·sql·mysql
小刘|9 小时前
深入理解 SQL 注入漏洞及解决方案
数据库·sql
数巨小码人9 小时前
QT SQL框架及QSqlDatabase类
jvm·sql·qt
哆木10 小时前
排查生产sql查询缓慢
数据库·sql·mysql
羊小猪~~15 小时前
MYSQL学习笔记(九):MYSQL表的“增删改查”
数据库·笔记·后端·sql·学习·mysql·考研
桃林春风一杯酒16 小时前
HADOOP_HOME and hadoop.home.dir are unset.
大数据·hadoop·分布式
史迪仔011216 小时前
[SQL] 事务的四大特性(ACID)
数据库·sql
clarance201516 小时前
聊聊 FocusSearch/focus_mcp_sql:Text2SQL 的新玩法
数据库·sql