多线程环境下还敢用System.out.println?坑!

背景

一个文件采集系统,使用了多线程递归采集指定目录下的文件,并为每个目录创建一个线程去采集。

这个应用每隔几天就出现罢工情况,查看进程还在,堆内存空间还很充足,就是导出堆栈时,发现所有的采集线程都处于 BLOCKED 状态了:

bash 复制代码
"thread/dir/1718963987160" #82581 prio=5 os_prio=0 tid=0x00007f498c109000 nid=0x3d359a waiting for monitor entry [0x00007f48fcdfe000]
   java.lang.Thread.State: BLOCKED (on object monitor)
	at java.io.PrintStream.println(PrintStream.java:805)
	- waiting to lock <0x00000005cf055888> (a java.io.PrintStream)
	at com.xxx.XXX.sortFile(XXX.java:553)
...

下图是某次堆栈的内容,采集子目录过多时,创建的 292 个采集线程全阻塞了:

问题定位

定位到这个采集类的 sortFile 函数,里面第一行就是 System.out.println(dir) 打印当前处理的目录名称,在采集目录层级过多时,采集任务的线程达到了292 个,最终导致了线程阻塞。

为什么 System.out.println 会导致阻塞呢?

启示录

又想吐槽祖传代码了!生产环境里面大量的 System.out.println 真的是无语了。生产环境下,日志配置的 Logger 只是 FileLogger,控制台日志不会输出。这些控制台打印就成了影响程序性能的蛀虫,一不留神,还会造成本文介绍的死锁阻塞情况,直接拖挂了应用。

有点想念我刚入行时的那家企业,它是一家金融软件外包企业,虽说是外包,但当时行方对代码质量的严格要求,至今仍令我印象深刻,使用 findBugs 扫描出来的任何问题,包括警告都必须解决掉,否则行方就不允许上线。

从那儿学到的代码质量意识到现在还获益匪浅,之后就没有碰到过注重代码质量的企业了。

再总结一下简单的编码规范:

  1. 生产环境禁止 System.out.println 和 console 日志输出,前者存在本文的风险,后者会造成日志重复生产,引发磁盘空间的浪费,。
  2. 生产环境只允许一个 main 入口函数,其他所有测试的 main 函数必须删除,否则就容易成为后门。
相关推荐
Jinkey20 小时前
要用户手机号真的是为了打骚扰电话吗?浅谈微信生态会员账号体系与资产合并
后端·微信·微信小程序
葫芦和十三21 小时前
图解 MongoDB 06|模式演进:无 schema 是优势还是债
后端·mongodb·agent
葫芦和十三1 天前
图解 MongoDB 05|文档模型设计:内嵌 vs 引用,反范式不是免费午餐
后端·mongodb·agent
不能放弃治疗1 天前
单 Agent 实现模式
后端
IT_陈寒1 天前
Redis内存爆了,原来我漏掉了这个致命配置
前端·人工智能·后端
小bo波1 天前
从"任意文件复制"深挖Java I/O:字符流与字节流的本质抉择
java·nio·io流·后端开发·文件复制
fliter1 天前
最后一块拼图:用 bitvec 构造 IPv4 包,真正做出自己的 Ping
后端
fliter1 天前
用 Rust 解析并生成 ICMP 包:checksum、nom 与 cookie-factory
后端
蝎子莱莱爱打怪1 天前
XZLL-IM干货系列 03|消息 ID 设计:一个 UUID 搞不定的事,我用两个 ID 解决了
后端·面试·开源
fliter1 天前
从 panic 到 Result:用 Rust 重新整理一个 ping 项目的错误处理
后端