hive使用中的参数优化与问题排查

1.使用hive的虚拟列排查错误案例

set hive.exec.rowoffset=true;

SELECT

--输入文件名

INPUT__FILE__NAME,

--文件中的块内偏移量

BLOCK__OFFSET__INSIDE__FILE,

--文件行偏移量

ROW__OFFSET__INSIDE__BLOCK,

*

from hdp_lbg_zhaopin_defaultdb.zzdetail

where dt='20201117' and logtime is null;

根据结果找到对应的文件名称,根据文件名称将文件复制到本地,

hadoop文件系统复制到本地需要使用copyToLocal命令

hadoop fs -copyToLocal xxx ./yyy

lzo解压 lzop -dv xxx.lzo

在本地使用grep命令过滤出文件中出问题的行,以及其后的若干行,

方便查看问题影响的范围。

grep 'xxx' 目标文件名file -A 5 匹配查找到的及以后的20行内容

hive的一个优化 set hive.fetch.task.conversion;

explain extend

相关推荐
添柴少年yyds16 小时前
hive锁机制
数据仓库·hive·hadoop
蓝眸少年CY17 小时前
Hive - 安装与使用
数据仓库·hive·hadoop
旺仔小拳头..2 天前
Servlet概念与创建
数据仓库·hive·hadoop
旺仔小拳头..2 天前
Filter 过滤器 与Listener 监听器
数据仓库·hive·hadoop
晨晖22 天前
Servlet的快速入门,请求和响应
hive·hadoop·servlet
smchaopiao3 天前
Hive中的排序与分桶技术详解
数据仓库·hive·hadoop
tsyjjOvO5 天前
SpringMVC 从入门到精通
数据仓库·hive·hadoop
IvanCodes6 天前
Hive IDE连接及UDF实战
ide·hive·hadoop
lifewange7 天前
Hive数据库
数据库·hive·hadoop
五月天的尾巴8 天前
hive数据库模糊查询表名
hive·查询表名