目录
[1.1 Apache连接保持](#1.1 Apache连接保持)
[1.2 Apache 的访问控制](#1.2 Apache 的访问控制)
[1.2.1 客户机地址限制](#1.2.1 客户机地址限制)
[1.2.2 用户授权限制](#1.2.2 用户授权限制)
[1.2.2.1 创建用户认证数据文件](#1.2.2.1 创建用户认证数据文件)
[1.2.2.2 添加用户授权配置](#1.2.2.2 添加用户授权配置)
[1.2.2.3 验证用户访问授权](#1.2.2.3 验证用户访问授权)
[1.3 Apache 日志分割](#1.3 Apache 日志分割)
[1.3.1 Apache 自带rotatelogs 分割工具](#1.3.1 Apache 自带rotatelogs 分割工具)
[1.3.2 使用第三方工具cronolog 分割](#1.3.2 使用第三方工具cronolog 分割)
[1.4 AWStats 日志分析](#1.4 AWStats 日志分析)
[1.4.1 部署AWStats 分析系统](#1.4.1 部署AWStats 分析系统)
[1. 安装 AWStats 软件包](#1. 安装 AWStats 软件包)
[2. 为要统计的站点建立配置文件](#2. 为要统计的站点建立配置文件)
[3. 修改站点统计配置文件](#3. 修改站点统计配置文件)
[4. 执行日志分析,并设置cron计划任务](#4. 执行日志分析,并设置cron计划任务)
[1.4.2 访问 AWStats 分析系统](#1.4.2 访问 AWStats 分析系统)
前言
Apache HTTP Server 之所以受到众多企业的青睐,得益于其代码开源、跨平台、功能 模块化、可灵活定制等诸多优点,不仅性能稳定,在安全性方面的表现也十分出色。
1.1 Apache连接保持
HTTP 是属于应用层的面向对象协议,基于 TCP 协议之上的可靠传输。每次在进行
HTTP 连接之前,需要先进行 TCP 连接,在 HTTP 连接结束后要对 TCP 连接进行终止,每个TCP 连接都需要进行三次握手与四次断开。 HTTP 协议不会对之前发生过的请求和响应进行管理,所以频繁地建立与关闭连接对于 HTTP 而言会消耗更多的内存与 CPU 资源。能不能允许通过同一个 TCP 连接发出多个请求,从而减少与多个连接相关的延迟,解决办法就是连接保持。
对于 HTTP/1.1 ,就是尽量地保持客户端的连接,通过一个连接传送多个 HTTP 请求响
应,对于客户端可以提高 50% 以上的响应时间,对于服务器可以降低资源开销。
Apache 通过设置配置文件 httpd-default.conf 中相关的连接保持参数来开启与控制连接
保持功能。
- KeepAlive:决定是否打开连接保持功能,后面接 OFF 表示关闭,接 ON 表示打开,可以根据网站的并发请求量决定是否打开,即在高并发时打开连接保持功能,并发量不高时关闭此功能。
- KeepAliveTimeout:表示一次连接多次请求之间的最大间隔时间,即两次请求之间超过该时间连接就会自动断开,从而避免客户端占用连接资源。
- MaxKeepAliveRequests:用于设置在一次长连接中可以传输的最大请求数量,超过此最大请求数量就会断开连接,最大值的设置决定于网站中网页的内容,一般设置数量会多于网站中所有的元素。
1.2 Apache 的访问控制
为了更好地控制对网站资源的访问,可以为特定的网站目录添加访问授权。本章将分别介绍客户机地址限制、用户授权限制,这两种访问控制方式都应用于 httpd.conf 配置文件中的目录区域<Directory 目录位置> ...... </Directory>范围内。
1.2.1 客户机地址限制
通过 Require 配置项,可以根据客户端的主机名或 IP 地址来决定是否允许客户端访问。在 httpd 服务主配置文件的 <Location> 、 <Directory> 、 <Files> 、 <Limit> 配置段中均可以使用 Require 配置项来控制客户端的访问。使用 Require 配置项时,需要设置客户端地址以构成完整的限制策略,地址形式可以是 IP 地址、网络地址、主机名或域名。当 Require 配置项之后为"all" 时,表示匹配任意地址。限制策略的格式如下所示
- Require all granted:允许所有主机访问;
- Require all denied:拒绝所有主机访问;
- Require local:仅允许本地主机访问;
- Require [not] host <主机名或域名列表>:允许或拒绝指定主机或域名访问;
- Require [not] ip <IP 地址或网段列表>:允许或拒绝指定 IP 地址网络访问。
通常情况下,网站服务器是对所有客户机开放的,网页文档目录并未做任何限制,因此
使用的是 "Require all granted" 的策略,表示允许从任何客户机访问,策略格式如下所示。
<Directory "/usr/local/httpd/htdocs">
....... 省略部分内容
Require all granted
</Directory>
定义限制策略时,多个不带 "not" 的 Require 配置语句之间是 " 或 " 的关系,即任意一条
Require 配置语句满足条件均可访问。若既出现了不带 "not" 的 Require 配置语句,又出现了带"not" 的 Require 配置语句,则配置语句之间是 " 与 " 的关系,即同时满足所有 Require 配置语句才能访问。
需要使用 " 仅允许 " 的限制策略时,应使用 Require 配置语句明确设置允许策略,只允许
一部分主机访问。例如,若只希望 IP 地址为172.16.37.148 的主机能够访问,目录区域应做如下设置。
<Directory "/usr/local/httpd/htdocs/wwwtest">
...... 省略部分内容
Require ip 172.16.37.148
</Directory>
反之,需要使用 " 仅拒绝 " 的限制策略时,灵活使用 Require 与 Require not 配置语句设
置 拒 绝 访 问 策 略 , 仅 禁 止 一 部 分 主 机 访 问 。 在 使 用 not 禁 止 访 问 时 要 将 其 置 于
<RequireAll></RequireAll> 容器中,并在容器中设置相应的限制策略。例如,若只希望禁止来自两个内网网段 192.168.0.0/24 和 192.168.1.0/24 的主机访问,但允许其他任何主机访问,可以使用如下限制策略。
<Directory "/usr/local/httpd/htdocs/wwwtest">
...... 省略部分内容
<RequireAll>
Require all granted
Require not ip 192.168.0.0/24 192.168.1.0/24
</RequireAll>
</Directory>
当未被授权的客户机访问网站目录时,将会被拒绝访问。
1.2.2 用户授权限制
httpd 服务器支持使用摘要认证( Digest )和基本认证( Basic )两种方式。使用摘要认
证需要在编译 httpd 之前添加 "--enable-auth-digest"选项,但并不是所有的浏览器都支持摘要认证;而基本认证是 httpd 服务的基本功能,不需要预先配置特别的选项。
基于用户的访问控制包含认证( Authentication )和授权( Authorization )两个过程。
认证是指识别用户身份的过程,授权是指允许特定用户访问特定目录区域的过程。下面将以基本认证方式为例,添加用户授权限制。
1.2.2.1 创建用户认证数据文件
httpd 的基本认证通过校验用户名、密码组合来判断是否允许用户访问。授权访问的用
户账号需要事先建立,并保存在固定的数据文件中。使用专门的 htpasswd 工具程序,可以创建授权用户数据文件,并维护其中的用户账号。
使用 htpasswd 工具时,必须指定用户数据文件的位置,添加 "-c" 选项表示新建立此文
件。例如,执行以下操作可以新建数据文件 /usr/local/httpd/conf/.awspwd ,其中包含一个名为 webadmin 的用户信息。
[root@www ~]# cd /usr/local/httpd/
[root@www httpd]# bin/htpasswd -c /usr/local/httpd/conf/.awspwd webadmin
New password:
Re-type new password:
Adding password for user webadmin
[root@www httpd]# cat /usr/local/httpd/conf/.awspwd
webadmin:$apr1$puj.M9Bf$ZyAKvsxcx2jKw6GlzqwTK/
[root@www httpd]#
若省略 "-c" 选项,则表示指定的用户数据文件已经存在,用于添加新的用户或修改现有
用户的密码。例如,需要向 .awspwd 数据文件中添加一个新用户 kcce 时,可以执行以下操作。
[root@www httpd]# bin/htpasswd /usr/local/httpd/conf/.awspwd zhangsan
New password:
Re-type new password:
Adding password for user zhangsan
[root@www httpd]# cat /usr/local/httpd/conf/.awspwd
webadmin:$apr1$puj.M9Bf$ZyAKvsxcx2jKw6GlzqwTK/
zhangsan:$apr1$krVhdhr3$hzuXofqByQu8APNgeOatK.
[root@www httpd]#
1.2.2.2 添加用户授权配置
有了授权用户账号以后,还需要修改 httpd.conf 配置文件,在特定的目录区域中添加授
权配置,以启用基本认证并设置允许哪些用户访问。例如,若只允许 .awspwd 数据文件中的任一用户访问系统,可以执行以下操作。
[root@www ~]# vim /usr/local/httpd/conf/httpd.conf ...... //省略部分内容
<Directory "/usr/local/httpd/htdocs"> ...... //省略部分内容
AuthName "DocumentRoot" AuthType Basic
AuthUserFile /usr/local/httpd/conf/.awspwd
Require valid-user
</Directory>
[root@www ~]# systemctl restart httpd //重启服务使配置生效
在上述配置内容中,相关配置项的含义如下。
- AuthName**:**定义受保护的领域名称,该内容将在浏览器弹出的认证对话框中显示。
- AuthType**:**设置认证的类型,Basic 表示基本认证。
- AuthUserFile**:**设置用于保存用户账号、密码的认证文件路径。
- require valid-user**:**要求只有认证文件中的合法用户才能访问。其中,valid-user 表示
所有合法用户,若只授权给单个用户,可改为指定的用户名(如 webadmin)。
1.2.2.3 验证用户访问授权
当访问系统时,浏览器会首先弹出认证对话框,如图下图 所示。只有输入正确的用户名
和密码后才能查看特定目录下的网站资源,否则将拒绝访问。
1.3 Apache 日志分割
随着网站的访问量越来越大,默认情况下 Apache 服务器产生的单个日志文件也会越来
越大,如果不对日志进行分割,那么如果日志文件占用磁盘空间很大的话势必会将整个日志文件删除,这样也丢失了很多对网站比较宝贵的信息,而这些日志可以用来进行访问分析、网络安全监察、网络运行状况监控等。
另外,如果服务器遇到故障时,运维人员要打开日志文件进行分析,打开的过程会消耗
很长时间,也势必会增加处理故障的时间。因此管理好这些海量的日志对网站的意义很大,我们会将 Apache 的日志进行按每天的日期自动分割。下面介绍两种方法均可实现。
1.3.1 Apache 自带rotatelogs 分割工具
首先,将 Apache 主配置文件 httpd.conf 打开,配置网站的日志文件转交给 rotatelogs
分割处理。
[root@www ~]# mkdir /var/log/httpd/
[root@www ~]# vim /usr/local/httpd/conf/httpd.conf
...... //省略部分内容
ErrorLog "|/usr/local/bin/rotatelogs -l /var/log/httpd/error_%Y%m%d.log 86400"
CustomLog "|/usr/local/bin/rotatelogs -l /var/log/httpd/access_%Y%m%d.log 86400" combined
[root@www ~]# systemctl restart httpd
[root@www ~]# ll /var/log/httpd/
总用量 8
-rw-r--r-- 1 root root 150 1 月 11 20:36 access_20200101.log
-rw-r--r-- 1 root root 588 1 月 11 20:35 error_20200101.log
其中 ErrorLog 行是错误日志, -l 表示使用本地时间代替 GMT 时间作为时间基准。需要
注意的是在一个改变 GMT 偏移量 ( 比如夏令时 ) 的环境中使用 -l 会导致不可预料的结果。
CustomLog 行是定义访问日志格式, 86400 表示一天,即每天生成一个新的日志文件。
重启 Apache 服务,查看日志文件是否已经按日期分割。
1.3.2 使用第三方工具cronolog 分割
除了 Apache 自带 rotatelogs 分割工具,也可使用第三方工具 cronolog 对 Apache 日志
进行分割,具体操作如下所示。
(1)编译安装 cronolog 工具
[root@www ~]# tar zxvf cronolog-1.6.2.tar.gz
[root@www ~]# cd cronolog-1.6.2
[root@www cronolog-1.6.2]# ./configure
[root@www cronolog-1.6.2]# make && make install
(2)设置 cronolog 工具工具分割Apache日志
[root@www ~]# vim /usr/local/httpd/conf/httpd.conf
ErrorLog "| /usr/local/sbin/cronolog -l /var/log/httpd/www.bdqn.com-error_%Y%m%d.log 86400"
CustomLog "| /usr/local/sbin/cronolog -l /var/log/httpd/www.bdqn.com-access_%Y%m%d.log 86400" combined
[root@www ~]# systemctl restart httpd.service
1.4 AWStats 日志分析
在 httpd 服务器的访问日志文件 access_log 中,记录了大量的客户机访问信息,通过
分析这些信息,可以及时了解 Web 站点的访问情况,如每天或特定时间段的访问 IP 数量。点击量最大的页面等。
1.4.1 部署AWStats 分析系统
AWStats 是使用 Perl 语言开发的一款开源日志分析系统,它不仅可用来分析 Apache 网
站服务器的访问日志,也可以用来分析 Samba 、 Vsftpd 、 IIS 等服务的日志信息。结合 crond等计划任务服务,可以对不断增长的日志内容定期进行分析。
AWStats 的软件包可以从官方网站下载。下面以 awstats-7.7.tar.gz 软件包为例,介绍
为 Web 站点 www.kcg.com 添加 AWStats 日志分析系统的过程。
1. 安装 AWStats 软件包
Awstats 软件包的安装非常简单,只需将软件包解压到 httpd 服务器中的 /usr/local/ 目录
下即可。
[root@www ~]# tar zxf awstats-7.7.tar.gz
[root@www ~]# mv awstats-7.7 /usr/local/awstats
2. 为要统计的站点建立配置文件
AWStats 系统支持统计多个网站的日志文件,通常以网站名称来区分不同的站点。因
此,在执行日志文件分析之前,需要为每个 Web 站点建立站点统计配置文件,借助于
AWStats 系统提供的 awstats_configure.pl 脚本可以简化创建过程。
首先切换到 awstats/tools 目录下,并执行其中的 awstats_configure.pl 脚本。
[root@www ~]# cd /usr/local/awstats/tools/
[root@www tools]# ./awstats_configure.pl
之后将会进入一个交互式的配置过程,将会检查 awstats 的安装目录、 httpd 服务的配
置文件路径等系统环境,并提示用户指定站点名称、设置配置文件路径。
(1)指定httpd主配置文件的路径
----- AWStats awstats_configure 1.0 (build 20140126) (c) Laurent Destailleur -----
This tool will help you to configure AWStats to analyze statistics for
one web server. You can try to use it to let it do all that is possible
in AWStats setup, however following the step by step manual setup
documentation (docs/index.html) is often a better idea. Above all if:
- You are not an administrator user,
- You want to analyze downloaded log files without web server,
- You want to analyze mail or ftp log files instead of web log files,
- You need to analyze load balanced servers log files,
- You want to 'understand' all possible ways to use AWStats...
Read the AWStats documentation (docs/index.html).
-----> Running OS detected: Linux, BSD or Unix
-----> Check for web server install
Enter full config file path of your Web server.
Example: /etc/httpd/httpd.conf
Example: /usr/local/apache2/conf/httpd.conf
Example: c:\Program files\apache group\apache\conf\httpd.conf
Config file path ('none' to skip web server setup):
> /usr/local/httpd/conf/httpd.conf ## 输入httpd.conf配置文件的路径
(2)为指定的Web站点创建配置文件
根据提示继续选择" y "以创建站点配置文件,并指定要统计的目标网站名称、站点配
置文件的存放位置(默认为 /etc/awstats )。
-----> Need to create a new config file ?
Do you want me to build a new AWStats config/profile
file (required if first install) [y/N] ? y ##确认创建新的站点配置文件
-----> Define config file name to create
What is the name of your web site or profile analysis ?
Example: www.mysite.com
Example: demo
Your web site, virtual server or profile name:
>www.kgc.com ##指定要统计的目标网站名称
-----> Define config file path
In which directory do you plan to store your config file(s) ?
Default: /etc/awstats
Directory path to store config file(s) (Enter for default):
> //直接按 Enter 键接受默认设置
-----> Create config file '/etc/awstats/awstats.www.kgc.com.conf' Config file /etc/awstats/awstats.www.kgc.com.conf created.
...... //省略部分内容
(3)后续配置工作
后续配置工作接下来将会尝试重启 httpd 服务(支持使用 /sbin/service httpd restart 或/bin/systemctl restarthttpd.servic 命令重启,需要有相关脚本,否则手动重启 apache 服务),然后 设 置 cron 计 划 任 务 ( 7.6 版 本 尚 不 支 持 , 需 要 根 据 提 示 使 用
/usr/local/awstats/tools/awstats_updateall.pl now 命令,自行设置任务计划),按两次 Enter键退出配置工具。
Apache 2.4 以上版本,因为重新定义了访问权限,所以需要将自动生成的 awstats 访
问权限进行相应修改。同时,加载 CGI 模块。
[root@www ~]# vim /usr/local/httpd/conf/httpd.conf
ErrorLog "logs/error_log" CustomLog "logs/access_log" combined
<IfModule !mpm_prefork_module>
LoadModule cgid_module modules/mod_cgid.so
</IfModule>
<IfModule mpm_prefork_module>
LoadModule cgi_module modules/mod_cgi.so
</IfModule>
......
<Directory "/usr/local/awstats/wwwroot">
Options None
AllowOverride None
# Order allow,deny //注释掉
# Allow from all //注释掉
Require all granted //添加
</Directory>
[root@www ~]# systemctl restart httpd
根据上述设置过程,为网站 www.kgc.com 新建立的站点统计配置文件将存放到
/etc/awstats 目录下,文件名称为 awstats.www.kgc.com.conf 。若还需要统计其他 Web 站点的日志 , 可 以 执 行 awstats_configure.pl 脚 本 创 建 新 的 配 置 文 件 。 可 以 使用http://localhost/awstats/awstats.pl?config=www.kgc.com 地址访问日志分析页面。
3. 修改站点统计配置文件
为站点 www.kgc.com 建立好配置文件以后,还需要对其做进一步的修改。修改的内容
主要包括指定要分析的 Web 日志文件和指定用来存放统计数据的目录。
[root@www ~]#vim /etc/awstats/awstats.www.kgc.com.conf
LogFile="/usr/local/httpd/logs/access_log"
DirData="/var/lib/awstats"
...... ## 省略部分内容
[root@www ~]#mkdir /var/lib/awstats
其中, LogFile 用来指定日志路径,应设置 Web 日志文件的实际位置; DirData 用来指
定数据目录,可以采用默认值,但需要创建指定的目录( /var/lib/awstats )。
4. 执行日志分析,并设置cron计划任务
使用 AWStats 提供的 awstats_updateall.pl 脚本,可以更新所有站点(根据站点配置文
件)的日志统计数据。执行该脚本时,系统将会自动分析新增的日志内容,并将分析结果更新到统计数据库中。
[root@www ~]# cd /usr/local/awstats/tools/
[root@www tools]# chmod +x awstats_updateall.pl
[root@www tools]#./awstats_updateall.pl now
Running '"/usr/local/awstats/wwwroot/cgi-bin/awstats.pl" -update
-config=www.kgc.com -configdir="/etc/awstats"' to update config www.kgc.com
Create/Update database for config "/etc/awstats/awstats.www.kgc.com.conf" by
AWStats version 7.7 (build 20180105)
From data in log file "/usr/local/httpd/logs/access_log"... Phase 1 : First bypass old records, searching new record... Searching new records from beginning of log file... Jumped lines in file: 0
Parsed lines in file: 0
Found 0 dropped records, Found 0 comments, Found 0 blank records, Found 0 corrupted records, Found 0 old records, Found 0 new qualified records
由于 Web 日志文件的内容是在不断更新的,为了及时反馈网站访问情况,日志分析工
作也需要定期、自动地执行。通过 crond 服务可设置计划任务,一般建议每五分钟执行一次日志分析任务。
1.4.2 访问AWStats分析系统
访问站点 http://192.168.9.158/awstats/awstats.pl?config=www.kgc.com 后,即可看到
AWStats 日志分析系统的统计页面,该页面分别按访问时间、用户来源、所用浏览器等类别列出各种详细的网站访问情况,如图 3.2 所示。若此处访问出现 403 Forbidden 错误,关闭 selinux 即可正常访问。