一、HAProxy 简介
HAProxy 是由法国人 Willy Tarreau 开发的开源软件,专为处理高并发场景设计,能支持 10000 以上客户端同时连接,是高性能的 TCP 和 HTTP 负载均衡器。它提供高可用性、负载均衡以及基于 TCP 和 HTTP 的应用代理,支持虚拟主机,是免费、快速且可靠的负载均衡解决方案,尤其适合处理高负载站点的七层数据请求,还能屏蔽内部真实服务器,抵御攻击。
二、HAProxy 特点和优点
- 支持原生 SSL,同时支持客户端和服务器的 SSL。
- 支持 IPv6 和 UNIX 套字节(sockets)。
- 支持 HTTP Keep-Alive。
- 支持 HTTP/1.1 压缩,节省宽带。
- 支持优化健康检测机制(SSL、scripted TCP、check agent 等)。
- 支持 7 层负载均衡。
- 可靠性和稳定性非常好。
- 并发连接 40000-50000 个,单位时间处理最大请求 20000 个,最大数据处理 10Gbps。
- 支持 8 种负载均衡算法,同时支持 session 保持。
- 支持虚拟主机。
- 支持连接拒绝、全透明代理。
- 拥有服务器状态监控页面。
- 支持 ACL(access control list)。
三、HAProxy 保持会话的三种解决方法
为确保同一客户端访问服务器能保持会话,HAProxy 有以下三种解决方法:
- 通过客户端 IP 进行 Hash 计算并保存,使相同 IP 访问代理服务器时转发给固定的真实服务器。
- 依靠真实服务器发送给客户端的 Cookie 信息进行会话保持。
- 保存真实服务器的 Session 以及服务器标识,实现会话保持。(HAProxy 仅要求后端服务器网络联通,无需像 LVS 那样进行繁琐的 ARP 配置)
四、HAProxy 的 8 种负载均衡算法
- RR(Round Robin):轮询调度,将请求按顺序轮流分配给后端节点。例如三个节点 A、B、C,第一个用户到 A,第二个到 B,第三个到 C,第四个再到 A,以此类推。
- LC(Least Connections):最小连接数算法,根据后端节点连接数动态分配请求,将新请求分配给连接数最小的节点。
- SH(Source Hashing):基于来源访问调度算法,适用于服务端有 Session 会话记录的场景,可基于来源的 IP、Cookie 等进行集群调度,能实现会话保持,但可能因部分 IP 访问量大导致负载不均衡。
- uri(资源标识符):根据请求的 URI 调度,适用于 CDN(内容分发网络)。
- url_param(资源定位符):根据 HTTP 请求头锁定每次 HTTP 请求。
- rdp---cookie(name):根据 cookie(name)锁定并哈希每次 TCP 请求。
- source:根据请求的源 IP,类似 Nginx 的 IP hash 机制。
- static-rr:根据权重进行轮询。
五、HAProxy 主要工作模式
- tcp 模式:在客户端和服务器之间建立全双工连接,不处理七层报文,通常用于 SSL、SSH、SMTP 等应用层。
- http 模式(一般使用):转发客户端请求给后端服务器前会深度分析,拒绝所有不与 RFC 格式兼容的请求。
六、HAProxy 安装
6.1 通过 tar.gz 安装
- 准备 HAProxy 安装包(如 haproxy-2.9.5.tar.gz),传到 /opt 目录。
- 解压到 /usr/local/src:
bash
tar -zxvf haproxy-2.9.5.tar.gz -C /usr/local/src
cd /usr/local/src/haproxy-2.9.5/
- 查询系统内核版本:
bash
uname -r
- 编译,centos6.X 用 TARGET=linux26,centos7.x 用 linux31:
bash
make TARGET=linux31 PREFIX=/usr/local/haproxy [ARCH=x86_64]
- 安装到 /usr/local/haproxy 目录:
bash
make install PREFIX=/usr/local/haproxy
- 创建目录和配置文件:
bash
mkdir -p /usr/data/haproxy/
vim /usr/local/haproxy/haproxy.cfg
6.2 通过 yum 安装
bash
yum -y install haproxy
七、HAProxy 配置文件参数
HAProxy 配置文件 haproxy.cfg 的默认地址为 /etc/haproxy/haproxy.cfg,由 global 和 proxies 两大部分组成。
7.1 global 全局配置
包含进程及安全配置、性能调整、Debug 等相关参数,例如:
- chroot:锁定运行目录
- deamon:以守护进程运行
- user、group、uid、gid:运行 haproxy 的用户身份
- nbproc:开启的 haproxy 进程数,与 CPU 保持一致
- maxconn:每个 haproxy 进程的最大并发连接数
- log:定义全局的 syslog 服务器
示例:
bash
global
chroot /var/haproxy # 锁定运行目录
uid 99 # 所属运行的用户uid
gid 99 # 所属运行的用户组
daemon # 守护进程。以后台形式运行haproxy
nbproc 1 # haproxy进程数,与CPU保持一致
pidfile /var/run/haproxy.pid # haproxy的pid存放路径
ulimit-n 65535 # ulimit的数量限制
maxconn 20480 # 默认最大连接数
log 127.0.0.1 local0 # 日志输出配置
log 127.0.0.1 local1 notice # notice为日志级别
7.2 proxies 代理配置
主要包括 defaults、frontend、backend、listen 四部分。
7.2.1 defaults
为 frontend、backend、listen 提供默认配置,例如:
- option redispatch:当服务器挂掉后,强制定向到其他健康服务器
- mode http:默认工作类型
- timeout connect:客户端请求到后端 server 的最长连接等待时间
- balance roundrobin:默认的负载均衡方式
示例:
bash
defaults
log global # 应用全局日志配置
mode http # 处理类别为http(7层)
maxconn 20480 # 最大连接数
option httplog # 日志类别为http日志格式
option httpclose # 每次请求完毕后主动关闭http通道
option dontlognull # 不记录健康检查的日志信息
option forwardfor # 让后端服务器获得客户端真实ip
option redispatch # 服务器挂掉后强制定向到其他健康服务器
option abortonclose # 服务器负载高时结束久等连接
stats refresh 30 # 统计页面刷新间隔
retries 3 # 检查节点服务器失败次数
balance roundrobin # 负载均衡方式为轮询
contimeout 5000 # 连接超时时间
clitimeout 50000 # 客户端超时时间
srvtimeout 50000 # 服务器超时时间
timeout check 2000 # 心跳检测超时时间
7.2.2 frontend
指定接收客户端侦听套接字设置,类似 Nginx 的 server {},可定义 ACL 策略进行匹配操作。
示例:
bash
frontend http_80_in
bind 0.0.0.0:80 # 监听端口
mode http # http的7层模式
log global # 应用全局的日志配置
option httplog # 启用http的log
option httpclose # 每次请求完毕后主动关闭http通道
option forwardfor # 让后端服务器获得客户端真实IP
# acl策略配置
acl itnihao_web hdr_reg(host) -i ^(www.itnihao.cn|ww1.itnihao.cn)$
acl itnihao_blog hdr_dom(host) -i blog.itnihao.cn
# acl策略匹配相应
use_backend server_web if itnihao_web
use_backend server_blog if itnihao_blog
default_backend server_bbs # 以上都不满足时使用默认backend
7.2.3 backend
指定将连接请求转发至后端服务器的相关设置,类似 Nginx 的 upstream {}。
示例:
bash
backend server_web
mode http # http的7层模式
balance roundrobin # 负载均衡方式为轮询
cookie SERVERID # 允许插入serverid到cookie中
option httpchk GET /index.html # 心跳检测的文件
server web1 192.168.16.2:80 cookie web1 check inter 1500 rise 3 fall 3 weight 1
server web2 192.168.16.3:80 cookie web2 check inter 1500 rise 3 fall 3 weight 2
7.2.4 listen
同时拥有前端和后端配置,只对 TCP 有效,可用于配置监控页面等。
示例(监控页面配置):
bash
listen admin_status
bind 0.0.0.0:65532 # 监听端口
mode http # http的7层网络模式
log 127.0.0.1 local3 err # 错误日志记录
stats refresh 5s # 每隔5秒自动刷新监控页面
stats uri /admin?stats # 监控页面的url
stats realm itnihao\ itnihao # 监控页面的提示信息
stats auth admin:admin # 监控页面的用户和密码
stats auth admin1:admin1 # 另一个用户和密码
stats hide-version # 隐藏HAproxy版本信息
stats admin if TRUE # 手工启用/禁用后端服务器
7.3 完整配置文件示例
bash
global
log /dev/log local0 info
log /dev/log local0 notice
maxconn 4096
uid 99
gid 99
daemon
defaults
log global
mode http
option httplog
retries 3
maxconn 4096
contimeout 5000
clitimeout 50000
srvtimeout 50000
listen webcluster 0.0.0.0:80
option httpchk GET /index.html
balance roundrobin
server inst1 192.168.200.103:80 check inter 2000 fall 3
server inst2 192.168.200.104:80 check inter 2000 fall 3
listen admin_stats
bind 0.0.0.0:8000
mode http
option httplog
maxconn 100
stats refresh 30s
stats uri /stats
stats realm Crushlinux\ Haproxy
stats auth admin:admin
stats hide-version
八、服务自启动脚本配置
bash
cp /usr/src/haproxy-2.9.5/examples/haproxy.init /etc/init.d/haproxy
ln -s /usr/local/sbin/haproxy /usr/sbin/haproxy
chmod +x /etc/init.d/haproxy
/etc/init.d/haproxy start
# 将haproxy服务交由systemd管理
chkconfig --add /etc/init.d/haproxy
# 启动
systemctl start haproxy
# 设置开机自启
chkconfig --level 35 haproxy on
九、Haproxy 日志配置
Haproxy 日志默认输出到系统 syslog,为便于管理可单独配置:
- 修改 haproxy.cfg 的 global 选项:
bash
log /dev/log local0 info
log /dev/log local0 notice
- 重启 haproxy:
bash
service haproxy restart
- 在 /etc/rsyslog.d/ 下创建 haproxy.conf:
bash
if ($programname == 'haproxy' and $syslogserverity-text == 'info') then -/var/log/haproxy/haproxy-info.log &~
if ($programname == 'haproxy' and $syslogserverity-text == 'notice') then -/var/log/haproxy/haproxy-notice.log &~
- 重启 rsyslog 服务:
bash
service rsyslog restart
十、状态统计功能测试
仅七层可配置状态统计功能:
bash
listen stats # 定义监控页面
mode http
option httplog
bind *:1080 # 绑定端口1080
stats refresh 30s # 每30秒更新监控数据
stats uri /stats # 访问监控页面的uri
stats realm HAProxy\ Stats # 监控页面的认证提示
stats auth admin:admin # 监控页面的用户名和密码
配置后,可通过访问对应端口和 URI 查看监控页面。