Hive sql执行文件合并配置参数

HIVE自动合并输出的小文件的主要优化手段为:HIVE将会启动一个独立的map-reduce任务进行输出文件的merge。

set hive.merge.mapfiles = true:

在只有map的作业结束时合并小文件,

set hive.merge.mapredfiles = true:

在Map-Reduce的任务结束时合并小文件,默认为False;

set hive.merge.size.per.task = 256000000;

合并后每个文件的大小,默认256M

set hive.merge.smallfiles.avgsize=16000000;

当输出文件的平均大小小于16M时合并。

set hive.merge.orcfile.stripe.level=false;

当设置为true,orc文件进行stripe Level级别的合并,当设置为false,orc文件进行文件级别的合并。

相关推荐
whn197712 小时前
为了测试性能,构造几个达梦慢sql
数据库·sql
毅炼13 小时前
MySQL 常见问题总结(3)
数据库·sql·mysql
杨云龙UP13 小时前
ODA-Oracle实践记录:通过Navicat导出导入表CSV文件并清理重复数据,处理OA待办延迟刷新问题_20260416
linux·运维·服务器·数据库·sql·mysql·oracle
xuhaoyu_cpp_java13 小时前
MySql学习(四)
数据库·经验分享·笔记·sql·学习·mysql
数厘13 小时前
2.20 sql基础聚合函数(COUNT、SUM、AVG、MAX、MIN)
数据库·sql·oracle
元拓数智15 小时前
从 SQL 到自然语言:Arilink 语义治理与智能查询平台深度解析
数据库·sql·自然语言处理·智能问数
考虑考虑16 小时前
SQL语句中的模糊查询注意
后端·sql·mysql
matlabgoodboy16 小时前
留学生计算机cs作业辅导java SQL数据库 c语言编程 软件工程辅导
java·数据库·sql
隐于花海,等待花开17 小时前
窗口函数之排序函数详细解读及示例
大数据·数据库·hive
毅炼18 小时前
MyBatis 常见问题总结
java·数据库·sql·mybatis