大数据工具之HIVE-参数调优,调度乱码(二)

一、调度乱码

在利用HUE工具,搭建WORKFLOW流程的过程中,如果直接执行hivesql数据正常,不会出现乱码现象,如果利用WORKFLOW搭建的流程,进行数据的拉取,会出现数据中文乱码现象,这些乱码主要是由于select 中的硬编码中文导致出现的现象

具体现象如下:

select

case

when a = '' then '中国'

类似这种编码,导致的结果是:

解决方案:

在利用workflow搭建的流程中进行如下配置处理

在配置调度时,添加配置:

key: yarn.app.mapreduce.am.admin-command-opts

value: -Dfile.encoding=UTF-8

具体位置:

二、Hive 卡在map = 0%, reduce = 0%阶段

Hive 卡在map = 0%, reduce = 0%阶段

解决:增加map个数,设置mapreduce.input.fileinputformat.split.maxsize 小于系统默认值,需要综合考虑调用更多map时候的消耗

定位时发现任务卡在map = 0%, reduce = 0%阶段,而且发现map分配数量很少,所以猜测分配map较慢,增加map数量可解决问题。

原因:分配map数量少,一个map处理的数据多,处理速度慢

解决:增加map的数据

具体现象:

相关推荐
智慧景区与市集主理人18 分钟前
5A景区智慧建设|突破转型瓶颈!巨有科技打造高标准智慧文旅标杆
大数据·人工智能·科技
北京领雁科技19 分钟前
领雁科技助力某商业银行企业手机银行数智化升级
大数据·人工智能·科技
2601_9547064919 分钟前
2026 云手机横评:傲晨云 VS 红手指 VS 雷电云,稳定性 / 性能 / 适配深度测评
大数据·智能手机
科技互联.23 分钟前
2026年仓储物流AMR品牌怎么选?普渡机器人等选型维度与ROI分析
大数据·人工智能·机器人
WL_Aurora39 分钟前
Flume数据采集工具深度解析与实战配置
大数据·flume
互联网江湖41 分钟前
腾讯的船“漏水”了,可灵AI会成为“补丁”吗?
大数据·人工智能
金融小师妹41 分钟前
基于全球能源供给扰动模型的原油市场重构:沙特产量跌至36年低位后的供需链式分析
大数据·人工智能·逻辑回归
Tutankaaa1 小时前
交通安全知识竞赛:文明出行,安全相伴
大数据·人工智能·安全
wanhengidc1 小时前
云手机与正常手机的区别
大数据·运维·服务器·人工智能·智能手机
CableTech_SQH1 小时前
南通肿瘤医院智能化建设解析 以太网全光 + 低烟无卤 B1 方案百盛分析报告
大数据·运维·服务器·网络·信息与通信