hive使用中的参数优化与问题排查

1.使用hive的虚拟列排查错误案例

set hive.exec.rowoffset=true;

SELECT

--输入文件名

INPUT__FILE__NAME,

--文件中的块内偏移量

BLOCK__OFFSET__INSIDE__FILE,

--文件行偏移量

ROW__OFFSET__INSIDE__BLOCK,

*

from hdp_lbg_zhaopin_defaultdb.zzdetail

where dt='20201117' and logtime is null;

根据结果找到对应的文件名称,根据文件名称将文件复制到本地,

hadoop文件系统复制到本地需要使用copyToLocal命令

hadoop fs -copyToLocal xxx ./yyy

lzo解压 lzop -dv xxx.lzo

在本地使用grep命令过滤出文件中出问题的行,以及其后的若干行,

方便查看问题影响的范围。

grep 'xxx' 目标文件名file -A 5 匹配查找到的及以后的20行内容

hive的一个优化 set hive.fetch.task.conversion;

explain extend

相关推荐
多多*7 小时前
Java反射 八股版
java·开发语言·hive·python·sql·log4j·mybatis
yyf96012610 小时前
hiveserver2与beeline进行远程连接hive配置及遇到的问题
数据仓库·hive
yyf96012610 小时前
hive在配置文件中添加了hive.metastore.uris之后进入hive输入命令报错
hive
jiedaodezhuti11 小时前
hive两个表不同数据类型字段关联引发的数据倾斜
数据仓库·hive·hadoop
IvanCodes11 小时前
五、Hive表类型、分区及数据加载
大数据·数据仓库·hive
静听山水1 天前
Hive JOIN 优化策略详解
hive
Microsoft Word1 天前
数据仓库Hive
数据仓库·hive·hadoop
IvanCodes1 天前
四、Hive DDL表定义、数据类型、SerDe 与分隔符核心
大数据·hive·hadoop
IvanCodes2 天前
三、Hive DDL数据库操作
大数据·数据库·hive·hadoop
IT成长日记2 天前
【Hive入门】Hive数据导入与导出:批量操作与HDFS数据迁移完全指南
hive·hadoop·hdfs·数据导入与导出·load data