Hive sql执行文件合并配置参数

HIVE自动合并输出的小文件的主要优化手段为:HIVE将会启动一个独立的map-reduce任务进行输出文件的merge。

set hive.merge.mapfiles = true:

在只有map的作业结束时合并小文件,

set hive.merge.mapredfiles = true:

在Map-Reduce的任务结束时合并小文件,默认为False;

set hive.merge.size.per.task = 256000000;

合并后每个文件的大小,默认256M

set hive.merge.smallfiles.avgsize=16000000;

当输出文件的平均大小小于16M时合并。

set hive.merge.orcfile.stripe.level=false;

当设置为true,orc文件进行stripe Level级别的合并,当设置为false,orc文件进行文件级别的合并。

相关推荐
splage1 小时前
Oracle分页sql
数据库·sql·oracle
StarRocks_labs6 小时前
StarRocks I/O 模型揭秘(一):查询是如何被拆解与调度的?
starrocks·sql·pipeline·mpp·fe
cTz6FE7gA6 小时前
XSS、CSRF、SQL注入、防重放与敏感数据保护的分层策略
sql·xss·csrf
升职佳兴7 小时前
SQL 进阶4:查询从未下单的用户与 NOT EXISTS 完整解析
数据库·sql
武子康7 小时前
大数据-261 实时数仓-建设指南:从架构设计到业务落地 交易订单、订单产品、产品分类、商家店铺、地域组织表
大数据·hadoop·后端
wregjru8 小时前
【MySQL】4. 数据约束详解
数据库·sql·oracle
问道飞鱼9 小时前
【数据库相关】MySQL全分类SQL详解(超多数据类型+全约束+实战落地)
数据库·sql·mysql·范例
fe7tQnVan1 天前
MyBatis-动态sql与高级映射
数据库·sql·mybatis
lzhdim1 天前
SQL 入门 8:SQL 复杂查询:子查询与ALL关键词
数据库·sql·mysql
l1t1 天前
DeepSeek辅助编写的Oracle dmp转SQL脚本和CSV文件工具
数据库·人工智能·sql·oracle