官方文档：http://www.plumelog.com/zh-cn/docs/FASTSTART.html

简介

无代码入侵的分布式日志系统，基于log4j、log4j2、logback搜集日志，设置链路ID，方便查询关联日志
基于elasticsearch作为查询引擎
高吞吐，查询效率高
全程不占应用程序本地磁盘空间，免维护;对于项目透明，不影响项目本身运行
无需修改老项目，引入直接使用，支持dubbo,支持springcloud

架构

应用服务通过整合plumelog客户端，搜集日志并推送kafka，redis等队列
plumelog-server 负责把队列中的日志日志异步写入到elasticsearch
plumelog_ui为操作界面客户端，用于查询日志，使用各种定制功能

常见部署模型

单redis小集群模式，大部分中小规模项目
kafka集群模式，每个项目量都很大

功能

日志查询

扩展字段

在系统扩展字段里添加扩展字段，字段值为 orderid 显示值为订单编号
查询的时候选择应用名，下面会显示扩展字段，可以通过扩展字段查询

java 复制代码

MDC.put("orderid","1");
MDC.put("userid","4");
logger.info("扩展字段");

链路追踪

设置追踪码后，支持注解手动打点和切面全局打点

滚动日志

可以连接到机器上，查看实时日志

错误统计

错误报警

支持通过webhook自定义报警

索引管理

查看和操作ES索引

plumelog&ELK

plumelog日志是客户端上报的方式，客户端配置极其简单，不需要像logstash一样去解析日志的格式，因为plumelog客户端已经格式化好了，traceid的设计都是内置的，这些用户都不用刻意去管，跨线程跨应用链路传递都是内置的组件
部署简单，你只要个有redis，就行了，ELK组合要完成完整部署，可能还需要配置kafka,filebeat之类的组件，而且版本需统一
日志的查询速度大于ELK，因为plumelog查询是优化过的，比kibanna通用查询快很多，plumelog的查询界面就是专门按照国人习惯设计的
很多人用ELK到了大量日志的时候发现，检索效率极其下降，那是因为ES的索引等设计不合理造成的，plumelog专业处理日志，索引的设置都已经早就设计好了，不需要使用者自己去优化
ELK不是专业处理日志的，plumelog在日志上功能就很多，例如扩展字段，链路追踪，错误报警，错误统计后续还有QPS统计等功能，ELK都是没有的

多大体量

根据用户反馈，目前搜集到最大的用户每日日志量已经到达3TB，并稳定运行

部署应用

第一步：安装 redis 或者 kafka（一般公司redis足够） redis 官网:https://redis.io kafka：http://kafka.apache.org

第二步：安装 elasticsearch 官网下载地址:https://www.elastic.co/cn/downloads/past-releases

第三步：下载安装包，plumelog-server 下载地址：https://gitee.com/plumeorg/plumelog/releases

第四步：配置plumelog-server，并启动，redis和kafka作为队列模式下可以部署多个plumelog-server达到高可用，配置一样即可

第五步：后台查询语法详见plumelog使用指南

应用案例

以mservice为例，查询线上问题时，提供的是用户Id或订单号

之前查日志：

根据custId找到udid，根据订单号找到custId再找到udid。
到kibana根据udid和时间点找到对应的请求记录，找到对应的机器，找到请求的唯一标识"tc"
登录机器，根据"tc"参数查询elk日志，找到对应的线程号。
根据线程号和时间范围过滤default日志。

现在查询日志：

登录plumeLog页面，根据用户Id或订单号查询，即可查询到关键日志，大致定位问题。
根据日志的hostIp参数登录到机器根据追踪码过滤即可得到详细日志。

整合过程

pom添加依赖

xml 复制代码

<dependency>
    <groupId>com.plumelog</groupId>
    <artifactId>plumelog-logback</artifactId>
    <version>3.5.2</version>
</dependency>

logback.xml添加appender，注意区分测试和线上环境