Hive日志介绍

日志描述

日志路径:Hive相关日志的默认存储路径为"/var/log/Bigdata/hive/角色名",Hive1相关日志的默认存储路径为"/var/log/Bigdata/hive1/角色名",以此类推。

  • HiveServer:"/var/log/Bigdata/hive/hiveserver"(运行日志),"/var/log/Bigdata/audit/hive/hiveserver"(审计日志)。
  • MetaStore:"/var/log/Bigdata/hive/metastore"(运行日志),"/var/log/Bigdata/audit/hive/metastore"(审计日志)。
  • WebHCat:"/var/log/Bigdata/hive/webhcat"(运行日志),"/var/log/Bigdata/audit/hive/webhcat"(审计日志)

日志归档规则:Hive的日志启动了自动压缩归档功能,缺省情况下,当日志大小超过20MB的时候(此日志文件大小可进行配置),会自动压缩,压缩后的日志文件名规则为:"<原有日志名>-<yyyy-mm-dd_hh-mm-ss>.[编号].log.zip"。最多保留最近的20个压缩文件,压缩文件保留个数和压缩文件阈值可以配置

表 1 Hive日志列表

日志类型 日志文件名 描述
运行日志 /hiveserver/hiveserver.out HiveServer运行环境信息日志
运行日志 /hiveserver/hive.log HiveServer进程的运行日志
运行日志 /hiveserver/hive-omm-<日期>-<PID>-gc.log.<编号> HiveServer进程的GC日志
运行日志 /hiveserver/prestartDetail.log HiveServer启动前的工作日志
运行日志 /hiveserver/check-serviceDetail.log Hive服务启动是否成功的检查日志
运行日志 /hiveserver/cleanupDetail.log HiveServer卸载的清理日志
运行日志 /hiveserver/startDetail.log HiveServer进程启动日志
运行日志 /hiveserver/stopDetail.log HiveServer进程停止日志
运行日志 /hiveserver/localtasklog/omm_<日期>_<任务ID>.log Hive本地任务的运行日志
运行日志 /hiveserver/localtasklog/omm_<日期>_<任务ID>-gc.log.<编号> Hive本地任务的GC日志
运行日志 /metastore/metastore.log MetaStore进程的运行日志
运行日志 /metastore/hive-omm-<日期>-<PID>-gc.log.<编号> MetaStore进程的GC日志
运行日志 /metastore/postinstallDetail.log MetaStore安装后的工作日志
运行日志 /metastore/prestartDetail.log MetaStore启动前的工作日志
运行日志 /metastore/cleanupDetail.log MetaStore卸载的清理日志
运行日志 /metastore/startDetail.log MetaStore进程启动日志
运行日志 /metastore/stopDetail.log MetaStore进程停止日志
运行日志 /metastore/metastore.out MetaStore运行环境信息日志
运行日志 /webhcat/webhcat-console.out Webhcat进程启停正常日志
运行日志 /webhcat/webhcat-console-error.out Webhcat进程启停异常日志
运行日志 /webhcat/prestartDetail.log WebHCat启动前的工作日志
运行日志 /webhcat/cleanupDetail.log Webhcat卸载时或安装前的清理日志
运行日志 /webhcat/hive-omm-<日期>-<PID>-gc.log.<编号> WebHCat进程的GC日志
运行日志 /webhcat/webhcat.log WebHCat进程的运行日志
审计日志 hive-audit.log hive-rangeraudit.log HiveServer审计日志
审计日志 metastore-audit.log MetaStore审计日志
审计日志 webhcat-audit.log WebHCat审计日志
审计日志 jetty-<日期>.request.log Jetty服务的请求日志

日志级别

Hive提供了如表2所示的日志级别。

运行日志的级别优先级从高到低分别是ERROR、WARN、INFO、DEBUG,程序会打印高于或等于所设置级别的日志,设置的日志等级越高,打印出来的日志就越少。

表 2 日志级别

级别 描述
ERROR ERROR表示系统运行的错误信息。
WARN WARN表示当前事件处理存在异常信息。
INFO INFO表示记录系统及各事件正常运行状态信息。
DEBUG DEBUG表示记录系统及系统的调试信息。

如果您需要修改日志级别,请执行如下操作:

  1. 参考修改集群服务配置参数,进入Hive服务"全部配置"页面。

  2. 左边菜单栏中选择所需修改的角色所对应的日志菜单。

  3. 选择所需修改的日志级别并保存。

    说明:

    配置Hive日志级别后可立即生效,无需重启服务。

日志格式

Hive的日志格式如下所示:

表 3 日志格式

日志类型 格式 示例
运行日志 <yyyy-MM-dd HH:mm:ss,SSS>|<LogLevel>|<产生该日志的线程名字>|<log中的message>|<日志事件的发生位置> 2014-11-05 09:45:01,242 | INFO | main | Starting hive metastore on port 21088 | org.apache.hadoop.hive.metastore.HiveMetaStore.main(HiveMetaStore.java:5198)
审计日志 <yyyy-MM-dd HH:mm:ss,SSS>|<LogLevel>|<产生该日志的线程名字>|<User Name><User IP><Time><Operation><Resource><Result><Detail >|<日志事件的发生位置> 2018-12-24 12:16:25,319 | INFO | HiveServer2-Handler-Pool: Thread-185 | UserName=hive UserIP=10.153.2.204 Time=2018/12/24 12:16:25 Operation=CloseSession Result=SUCCESS Detail= | org.apache.hive.service.cli.thrift.ThriftCLIService.logAuditEvent(ThriftCLIService.java:434)
相关推荐
苛子20 小时前
2026国产化iPaaS集成平台选型与替换实战指南
数据仓库·etl
源码之家1 天前
计算机毕业设计:Python智慧交通大数据分析平台 Flask框架 requests爬虫 出行速度预测 拥堵预测(建议收藏)✅
大数据·hadoop·爬虫·python·数据分析·flask·课程设计
@insist1231 天前
数据库系统工程师-分布式数据库与数据仓库核心考点及应用体系
数据库·数据仓库·分布式·软考·数据库系统工程师·软件水平考试
莫叫石榴姐1 天前
本体论:企业智能化转型的核心引擎
大数据·数据仓库·人工智能·面试·职场和发展
武子康1 天前
大数据-257 离线数仓 - 数据质量监控详解:从理论到Apache Griffin实践
大数据·hadoop·后端
孤影过客3 天前
驯服数据巨兽:Hadoop如何重塑大数据的黄金时代
大数据·hadoop·分布式
极光代码工作室3 天前
基于Hadoop的日志数据分析系统设计
大数据·hadoop·python·数据分析·数据可视化
tumeng07114 天前
HDFS的架构优势与基本操作
hadoop·hdfs·架构
蓝眸少年CY4 天前
Hive - 函数、压缩与优化
数据仓库·hive·hadoop
仗剑_走天涯4 天前
Hadoop 安装
大数据·hadoop·分布式