解决Hadoop审计日志hdfs-audit.log过大的问题

【背景】

新搭建的Hadoop环境没怎么用,就一个环境天天空跑,结果今天运维告诉我说有一台服务器磁盘超过80%了,真是太奇怪了,平台上就跑了几个spark测试程序,哪来的数据呢?

【问题调查】

既然是磁盘写满了,那首先就要找到具体是什么数据写满的磁盘。

用df查看,是根目录,还不是数据盘;

复制代码
df -h

于是用du命令再挨个检查目录,看看具体是什么文件这么大

复制代码
du -h --maxx-depth=1 . 

终于发现在Hadoop的日志目录下,有一堆hdfs-audit.log日志,并且每个都有好几百M,删除之后,跟目录瞬间从81%减低到了42%;

问题是暂时解决了,可这样不是长久之计,审计日志还在写,过几天还得来删除。

【解决办法】

从Ambari页面上查看hdfs的配置,搜索关键字"audit"

接着往下拉,发现审计日志配置的是INFO级别:

于是改为WARN级别,保存后重启hdfs相关组件。

过了几天后,再检查服务器,发现磁盘根目录使用率没有明显增大,问题完美解决了~

相关推荐
电商API&Tina1 分钟前
【电商API】淘宝/天猫拍立淘(按图搜索商品)API 全解析
大数据·开发语言·数据库·人工智能·json·图搜索算法
五度易链-区域产业数字化管理平台3 分钟前
技术深一度|五度易链如何通过“AI+大数据”深度融合提升治理精准效能?
大数据·人工智能
亚林瓜子5 分钟前
Spark SQL中时间戳条件约束与字符串判空
大数据·sql·spark·string·timestamp
云边云科技_云网融合8 分钟前
下单、收银不中断,负载均衡是零售系统平稳运行的基石
大数据·网络·人工智能·安全
延凡科技7 小时前
无人机低空智能巡飞巡检平台:全域感知与智能决策的低空作业中枢
大数据·人工智能·科技·安全·无人机·能源
百家方案8 小时前
2026年数据治理整体解决方案 - 全1066页下载
大数据·人工智能·数据治理
zhangkaixuan4569 小时前
Paimon 读取数据流程深度解析
大数据·hadoop·flink·apache·paimon
清平乐的技术专栏11 小时前
HBase集群连接方式
大数据·数据库·hbase
梁下轻语的秋缘12 小时前
Prompt工程核心指南:从入门到精通,让AI精准响应你的需求
大数据·人工智能·prompt
福客AI智能客服12 小时前
工单智转:电商智能客服与客服AI系统重构售后服务效率
大数据·人工智能