多线程环境下还敢用System.out.println?坑!

背景

一个文件采集系统,使用了多线程递归采集指定目录下的文件,并为每个目录创建一个线程去采集。

这个应用每隔几天就出现罢工情况,查看进程还在,堆内存空间还很充足,就是导出堆栈时,发现所有的采集线程都处于 BLOCKED 状态了:

bash 复制代码
"thread/dir/1718963987160" #82581 prio=5 os_prio=0 tid=0x00007f498c109000 nid=0x3d359a waiting for monitor entry [0x00007f48fcdfe000]
   java.lang.Thread.State: BLOCKED (on object monitor)
	at java.io.PrintStream.println(PrintStream.java:805)
	- waiting to lock <0x00000005cf055888> (a java.io.PrintStream)
	at com.xxx.XXX.sortFile(XXX.java:553)
...

下图是某次堆栈的内容,采集子目录过多时,创建的 292 个采集线程全阻塞了:

问题定位

定位到这个采集类的 sortFile 函数,里面第一行就是 System.out.println(dir) 打印当前处理的目录名称,在采集目录层级过多时,采集任务的线程达到了292 个,最终导致了线程阻塞。

为什么 System.out.println 会导致阻塞呢?

启示录

又想吐槽祖传代码了!生产环境里面大量的 System.out.println 真的是无语了。生产环境下,日志配置的 Logger 只是 FileLogger,控制台日志不会输出。这些控制台打印就成了影响程序性能的蛀虫,一不留神,还会造成本文介绍的死锁阻塞情况,直接拖挂了应用。

有点想念我刚入行时的那家企业,它是一家金融软件外包企业,虽说是外包,但当时行方对代码质量的严格要求,至今仍令我印象深刻,使用 findBugs 扫描出来的任何问题,包括警告都必须解决掉,否则行方就不允许上线。

从那儿学到的代码质量意识到现在还获益匪浅,之后就没有碰到过注重代码质量的企业了。

再总结一下简单的编码规范:

  1. 生产环境禁止 System.out.println 和 console 日志输出,前者存在本文的风险,后者会造成日志重复生产,引发磁盘空间的浪费,。
  2. 生产环境只允许一个 main 入口函数,其他所有测试的 main 函数必须删除,否则就容易成为后门。
相关推荐
JustMove0n几秒前
互联网大厂Java面试全流程问答及技术详解
java·jvm·redis·mybatis·dubbo·springboot·多线程
超捻几秒前
04 python 数据类型转换
后端
IT_陈寒4 分钟前
Python开发者都在偷偷用的5个高效技巧,你竟然还不知道?
前端·人工智能·后端
kevinzeng6 分钟前
mysql和redis数据一致性的策略
后端
小码哥_常6 分钟前
一文搞懂双Token、SSO与第三方权限打通,附实战代码
后端
SimonKing9 分钟前
5分钟学会!把代码从本地推送到 GitHub,就是这么简单
java·后端·程序员
玹外之音9 分钟前
Spring AI 11 种文档切割策略全解析
java·spring·ai编程
灵境空间13 分钟前
企业微信 AI 机器人 PHP SDK —— 免回调地址,三行代码接入,支持流式回复
后端
陈随易19 分钟前
Vite 8正式发布,内置devtool,Wasm SSR 支持
前端·后端·程序员
CodeSheep27 分钟前
首个OpenClaw龙虾大模型排行榜来了,国产AI霸榜了!
前端·后端·程序员