如何分析 Nginx 日志

分析 Nginx 日志可以帮助我们了解服务器性能、流量来源、用户行为,以及诊断问题(如错误和攻击)。以下是详细的分析方法:


1. 日志类型

Nginx 有两种主要日志:

  • 访问日志 (Access Log):记录客户端对服务器的每个请求。
  • 错误日志 (Error Log):记录服务器运行中出现的错误。
访问日志格式

典型日志格式:

text 复制代码
$remote_addr - $remote_user [$time_local] "$request" $status $body_bytes_sent "$http_referer" "$http_user_agent"

字段解释

  • $remote_addr: 客户端 IP 地址。
  • $remote_user: 认证的用户(如果有)。
  • $time_local: 本地时间。
  • $request: 请求方法、路径和协议。
  • $status: HTTP 状态码。
  • $body_bytes_sent: 发送的响应大小。
  • $http_referer: 请求的来源页面。
  • $http_user_agent: 客户端的 User-Agent 字符串。

2. 常见分析场景

(1) 流量分析

统计访问量、热门资源和请求来源:

  • 统计访问 IP

    bash 复制代码
    awk '{print $1}' access.log | sort | uniq -c | sort -nr | head

    说明:统计每个 IP 的访问次数。

  • 统计访问 URL

    bash 复制代码
    awk '{print $7}' access.log | sort | uniq -c | sort -nr | head

    说明:统计最常访问的路径。

  • 统计 Referer

    bash 复制代码
    awk -F'"' '{print $4}' access.log | sort | uniq -c | sort -nr | head

    说明:查看流量来源。

(2) 状态码分析

找出出现错误的请求:

  • 统计状态码分布

    bash 复制代码
    awk '{print $9}' access.log | sort | uniq -c | sort -nr

    说明:统计每种 HTTP 状态码的次数。

  • 筛选特定状态码请求(如 404 错误):

    bash 复制代码
    awk '$9 == 404 {print $0}' access.log
(3) 排查慢请求

找出处理时间最长的请求(需要启用 $request_time$upstream_response_time 变量):

  • 按处理时间排序

    bash 复制代码
    awk '{print $10 " " $7}' access.log | sort -nr | head

    说明:找到耗时最长的请求。

(4) 攻击检测
  • 检测频繁访问的 IP

    bash 复制代码
    awk '{print $1}' access.log | sort | uniq -c | sort -nr | head

    说明:可能是攻击者尝试暴力请求。

  • 检测恶意 User-Agent

    bash 复制代码
    awk -F'"' '{print $6}' access.log | sort | uniq -c | sort -nr | head
(5) 错误日志排查

查看 Nginx 错误日志,定位问题:

bash 复制代码
tail -f /var/log/nginx/error.log

结合时间、错误码和描述信息,找出具体问题(如后端服务连接失败、配置错误等)。


3. 工具辅助分析

日志切割工具

日志可能很大,按日期切割以便于管理:

  • 使用 logrotate 配置自动切割。

  • 手动切割:

    bash 复制代码
    mv access.log access.log.$(date +%Y%m%d)
    systemctl reload nginx
分析工具
  • GoAccess (实时分析):

    安装后运行:

    bash 复制代码
    goaccess /path/to/access.log --log-format=COMBINED -o report.html

    生成直观的 HTML 报告。

  • AWStats (流量统计):

    对 Nginx 访问日志进行详细的统计分析。


4. 性能优化思路

通过分析日志,发现问题后可采取以下措施:

  1. 高频 IP 限制

    配置 limit_req 或使用防火墙阻止恶意 IP。

    nginx 复制代码
    limit_req_zone $binary_remote_addr zone=one:10m rate=10r/s;
  2. 静态文件缓存

    减少重复请求对服务器的压力。

  3. 优化后端服务

    根据慢请求分析,优化后端接口或数据库查询。


5. 示例综合分析

假设你收到很多 502 错误,分析步骤:

  1. 查看错误日志中的时间点和原因:

    bash 复制代码
    grep '502' /var/log/nginx/error.log
  2. 对比访问日志,找到 502 错误对应的请求和 IP:

    bash 复制代码
    awk '$9 == 502 {print $1, $7}' access.log
  3. 检查后端服务是否正常,查看响应时间。

相关推荐
YiSLWLL21 分钟前
Django+Nginx+uwsgi网站Channels+redis+daphne多人在线聊天实现粘贴上传图片
javascript·python·nginx·django
施嘉伟27 分钟前
PostgreSQL WAL日志膨胀处理
运维·数据库·postgresql
Oneforlove_twoforjob1 小时前
两个生活中的例子反向理解正/反向代理?
nginx·生活
wish3661 小时前
Clean Docker Images and Container by Cron Job
运维·经验分享·docker·容器·devops
dessler1 小时前
云计算&虚拟化-kvm-无损扩容磁盘&分区
linux·运维·云计算
一颗青果1 小时前
【Linux】磁盘 | 文件系统 | inode
linux·运维·服务器
As小神龙1 小时前
NFS服务器
运维·服务器
Allen Bright1 小时前
探索Linux的目录结构:深入理解文件系统的组织
linux·运维·服务器
周星星✘2 小时前
Docker使用教程
运维·docker·容器
路边小野花2 小时前
docker 创建容器后,容器内部yum不能在线拉取使用
运维·docker·容器