Hive sql执行文件合并配置参数

HIVE自动合并输出的小文件的主要优化手段为:HIVE将会启动一个独立的map-reduce任务进行输出文件的merge。

set hive.merge.mapfiles = true:

在只有map的作业结束时合并小文件,

set hive.merge.mapredfiles = true:

在Map-Reduce的任务结束时合并小文件,默认为False;

set hive.merge.size.per.task = 256000000;

合并后每个文件的大小,默认256M

set hive.merge.smallfiles.avgsize=16000000;

当输出文件的平均大小小于16M时合并。

set hive.merge.orcfile.stripe.level=false;

当设置为true,orc文件进行stripe Level级别的合并,当设置为false,orc文件进行文件级别的合并。

相关推荐
雷工笔记10 小时前
SQL语句解析:DESC LIMIT 1
数据库·sql
lzhdim11 小时前
SQL 入门 10:SQL 内置函数:数值、字符串与时间处理
前端·数据库·sql
隐于花海,等待花开12 小时前
为什么要避免 SELECT *
sql
Vin0sen16 小时前
Hadoop安装
大数据·hadoop·分布式
格鸰爱童话18 小时前
跟着AI学sql
数据库·sql
数厘18 小时前
2.13 sql数据更新(UPDATE)
数据库·sql·oracle
隐于花海,等待花开18 小时前
HIVE日期函数大全
数据仓库·hive·hadoop
℡終嚸♂68019 小时前
SQL 注入与 ThinkPHP 漏洞技术讲义
数据库·sql
不剪发的Tony老师1 天前
Noir:一款键盘驱动的现代化数据库管理工具
数据库·sql
光泽雨1 天前
UNION 和 UNION ALL 作用
数据库·sql