Drain: An Online Log Parsing Approach with Fixed Depth Tree

论文提出了一种名为 Drain 的在线日志解析方法，旨在解决由于日志量快速增长而导致的离线日志解析方法的效率问题。Drain 通过使用固定深度的解析树，并在树节点中编码特殊设计的规则，实现了日志的流式解析，并大大提高了解析效率和准确性。

现代云计算和服务导向架构（SOA）的普及使得日志分析在服务管理中变得至关重要。日志通常是唯一记录系统运行时信息的数据资源，然而，原始日志信息是非结构化的，需要解析成结构化事件以便进一步分析。现有大多数日志解析方法集中于离线批处理，而随着日志量的增加，这种方法变得越来越耗时。

Drain 提出了一个固定深度的解析树，用于在线解析日志信息。具体步骤包括：

Drain 在四个数据集（BGL、HPC、HDFS、Zookeeper）上表现出最高的准确性，并且在 Proxifier 数据集上也表现出与最佳方法相当的准确性。其他方法的准确性结果如表格所示：

Data Set	LKE	IPLoM	SHISO	Spell	Drain
BGL	0.67	0.99	0.87	0.98	0.99
HPC	0.17	0.65	0.53	0.82	0.84
HDFS	0.57	0.99	0.93	0.87	0.99
Zookeeper	0.78	0.99	0.68	0.99	0.99
Proxifier	0.85	0.85	0.85	0.87	0.86

Drain 在所有五个数据集上所需的运行时间最少，显著优于其他在线解析方法。运行时间结果如表格所示：

Dataset	LKE	IPLoM	SHISO	Spell	Drain	Improvement (%)
BGL	N/A	140.57	10964.55	447.14	115.96	74.07%
HPC	N/A	12.74	582.14	47.28	8.76	81.47%
HDFS	N/A	333.03	6649.23	676.45	325.7	51.85%
Zookeeper	N/A	2.17	87.61	5.27	1.81	65.65%
Proxifier	8888.49	0.38	8.41	0.87	0.27	68.97%

数据集：HDFS 日志数据集，用于异常检测任务。

Drain 在异常检测任务中表现优异，检测到 10720 个真实异常，仅有 278 个误报，几乎达到最优性能。结果如表格所示：

方法	解析准确性	报告异常	检测到的异常	误报
IPLoM	0.99	10998	10720	278
SHISO	0.93	13050	11143	1907
Spell	0.87	10949	10674	275
Drain	0.99	10998	10720	278
Ground truth	1.00	11473	11195	278

论文在五个实际日志数据集上评估了 Drain 的性能，包括 BlueGene/L、HPC、HDFS、Zookeeper 和 Proxifier 数据集。实验结果显示，Drain 在四个数据集上表现出最高的准确性，在运行时间上相较于最先进的在线解析器提高了 51.85% 到 81.47%。

Drain 是一种有效的在线日志解析方法，在准确性和效率上均优于现有的在线和离线日志解析方法。通过在实际应用中的评估，Drain 在异常检测任务中也表现出了良好的效果。