多线程环境下还敢用System.out.println?坑!

背景

一个文件采集系统,使用了多线程递归采集指定目录下的文件,并为每个目录创建一个线程去采集。

这个应用每隔几天就出现罢工情况,查看进程还在,堆内存空间还很充足,就是导出堆栈时,发现所有的采集线程都处于 BLOCKED 状态了:

bash 复制代码
"thread/dir/1718963987160" #82581 prio=5 os_prio=0 tid=0x00007f498c109000 nid=0x3d359a waiting for monitor entry [0x00007f48fcdfe000]
   java.lang.Thread.State: BLOCKED (on object monitor)
	at java.io.PrintStream.println(PrintStream.java:805)
	- waiting to lock <0x00000005cf055888> (a java.io.PrintStream)
	at com.xxx.XXX.sortFile(XXX.java:553)
...

下图是某次堆栈的内容,采集子目录过多时,创建的 292 个采集线程全阻塞了:

问题定位

定位到这个采集类的 sortFile 函数,里面第一行就是 System.out.println(dir) 打印当前处理的目录名称,在采集目录层级过多时,采集任务的线程达到了292 个,最终导致了线程阻塞。

为什么 System.out.println 会导致阻塞呢?

启示录

又想吐槽祖传代码了!生产环境里面大量的 System.out.println 真的是无语了。生产环境下,日志配置的 Logger 只是 FileLogger,控制台日志不会输出。这些控制台打印就成了影响程序性能的蛀虫,一不留神,还会造成本文介绍的死锁阻塞情况,直接拖挂了应用。

有点想念我刚入行时的那家企业,它是一家金融软件外包企业,虽说是外包,但当时行方对代码质量的严格要求,至今仍令我印象深刻,使用 findBugs 扫描出来的任何问题,包括警告都必须解决掉,否则行方就不允许上线。

从那儿学到的代码质量意识到现在还获益匪浅,之后就没有碰到过注重代码质量的企业了。

再总结一下简单的编码规范:

  1. 生产环境禁止 System.out.println 和 console 日志输出,前者存在本文的风险,后者会造成日志重复生产,引发磁盘空间的浪费,。
  2. 生产环境只允许一个 main 入口函数,其他所有测试的 main 函数必须删除,否则就容易成为后门。
相关推荐
瀚高PG实验室10 分钟前
HGDB集群(安全版)repmgr手动切换主备库
java·数据库·安全·瀚高数据库
CodeSheep19 分钟前
JetBrains官宣,又一个IDE可以免费用了!
前端·后端·程序员
刘新明198921 分钟前
Frida辅助分析OLLVM虚假控制流程(下)
java·开发语言·前端
第二只羽毛43 分钟前
重载和继承的实践
java·开发语言
间彧1 小时前
SpringBoot和Servlet的联系
后端
王嘉俊9251 小时前
设计模式--适配器模式:优雅解决接口不兼容问题
java·设计模式·适配器模式
间彧1 小时前
Spring Boot的DispatcherServlet是如何封装和扩展原生Servlet功能的?
后端
王嘉俊9251 小时前
设计模式--组合模式:统一处理树形结构的优雅设计
java·设计模式·组合模式
无名之辈J1 小时前
GC Overhead 的排查
后端
道19931 小时前
50 台小型无人车与50套穿戴终端 5 公里范围内通信组网方案深度研究
java·后端·struts