Hive sql执行文件合并配置参数

HIVE自动合并输出的小文件的主要优化手段为:HIVE将会启动一个独立的map-reduce任务进行输出文件的merge。

set hive.merge.mapfiles = true:

在只有map的作业结束时合并小文件,

set hive.merge.mapredfiles = true:

在Map-Reduce的任务结束时合并小文件,默认为False;

set hive.merge.size.per.task = 256000000;

合并后每个文件的大小,默认256M

set hive.merge.smallfiles.avgsize=16000000;

当输出文件的平均大小小于16M时合并。

set hive.merge.orcfile.stripe.level=false;

当设置为true,orc文件进行stripe Level级别的合并,当设置为false,orc文件进行文件级别的合并。

相关推荐
字符串str1 小时前
sql的基本技术栈
数据库·sql·oracle
剑之所向2 小时前
DataEase 做大屏,只认 2 种 SQL 格式
数据库·sql·正则表达式
被摘下的星星3 小时前
Hadoop伪分布式集群搭建实验原理概要
大数据·hadoop·分布式
Ujimatsu4 小时前
数据分析相关面试题-SQL部分
数据库·sql·数据分析
武子康5 小时前
大数据-258 离线数仓 - Livy与Griffin编译安装指南:大数据环境配置实战
大数据·hadoop·后端
mcooiedo7 小时前
mybatisPlus打印sql配置
数据库·sql
麦聪聊数据7 小时前
电商数据运营的最佳实践:WebSQL 如何兼顾数据分析效率与生产库安全
数据库·sql·低代码·restful
jnrjian8 小时前
RAC archivelog 在共享盘下就可以在一个node进行备份
数据库·sql
Elastic 中国社区官方博客10 小时前
从 Elasticsearch runtime fields 到 ES|QL:将传统工具适配到当前技术
大数据·数据库·sql·elasticsearch·搜索引擎·全文检索
赵优秀一一10 小时前
对课上SQL使用技巧示例补充
数据库·sql