大数据工具之HIVE-参数调优,调度乱码(二)

一、调度乱码

在利用HUE工具,搭建WORKFLOW流程的过程中,如果直接执行hivesql数据正常,不会出现乱码现象,如果利用WORKFLOW搭建的流程,进行数据的拉取,会出现数据中文乱码现象,这些乱码主要是由于select 中的硬编码中文导致出现的现象

具体现象如下:

select

case

when a = '' then '中国'

类似这种编码,导致的结果是:

解决方案:

在利用workflow搭建的流程中进行如下配置处理

在配置调度时,添加配置:

key: yarn.app.mapreduce.am.admin-command-opts

value: -Dfile.encoding=UTF-8

具体位置:

二、Hive 卡在map = 0%, reduce = 0%阶段

Hive 卡在map = 0%, reduce = 0%阶段

解决:增加map个数,设置mapreduce.input.fileinputformat.split.maxsize 小于系统默认值,需要综合考虑调用更多map时候的消耗

定位时发现任务卡在map = 0%, reduce = 0%阶段,而且发现map分配数量很少,所以猜测分配map较慢,增加map数量可解决问题。

原因:分配map数量少,一个map处理的数据多,处理速度慢

解决:增加map的数据

具体现象:

相关推荐
Arva .8 小时前
介绍一下你知道的锁
大数据
檐下翻书1738 小时前
集团组织架构图在线设计 多部门协作编辑工具
大数据·论文阅读·人工智能·物联网·架构·流程图·论文笔记
小王毕业啦9 小时前
2008-2023年 全国统一大市场发展水平
大数据·人工智能·数据挖掘·数据分析·数据统计·社科数据·实证数据
青云交9 小时前
Java 大视界 -- Java 大数据在智能医疗影像数据标注与疾病辅助诊断模型训练中的应用
java·大数据·多模态融合·医疗影像标注·辅助诊断·临床 ai·dicom 处理
摇滚侠9 小时前
ElasticSearch 教程入门到精通,测试工具、倒排索引、索引创建查询删除,笔记6、7、8、9
大数据·笔记·elasticsearch
大卫小东(Sheldon)9 小时前
SQL查询中的窗口函数(主要以 PostgreSQL 为例)
大数据·sql·postgre
张人玉9 小时前
大数据Hadoop系列——在ubuntu上安装pig数据库
大数据·hadoop·ubuntu·pig
智链RFID9 小时前
RFID资产管理系统:智能管理新利器
大数据·人工智能
一个天蝎座 白勺 程序猿9 小时前
KingbaseES在国家电网领域的深度应用与实践——国家电网新一代集控系统
大数据·数据迁移·kingbase·金仓数据库
李慕婉学姐10 小时前
【开题答辩过程】以《基于Hadoop的医生相关数据分析与可视化及医生推荐系统》为例,不知道这个选题怎么做的,不知道这个选题怎么开题答辩的可以进来看看
大数据·hadoop·数据分析