负载均衡--HAProxy安装及搭建tidb数据库负载服务

作为一名开发人员，随着经验的增加和技术的沉淀，需要提高自己架构方面的知识，同时对于一个企业来说，搭建一套高可用、高性能的技术架构，对于公司的业务开展和提高服务的性能也是大有裨益的。本文重点从软件安装和搭建tidb负载均衡数据库服务介绍下HAProxy的使用

1.概述

HAProxy是由 C 语言编写的自由开放源码的软件，提供高可用性、负载均衡和代理服务，它是免费、快速并且可靠的一种解决方案。HAProxy 特别适用于那些负载特大的 web 站点，完全可以支持数以万计的并发连接，同时可以保护你的 web 服务器不被暴露到网络上。

其最常见的用途是将客户端请求分发到多个服务器上，从而实现高并发和高可用性。

2.负载均衡常用软件及对比

常用的负载均衡软件有LVS、Nginx和HAProxy，区别如下

LVS基于Linux操作系统内核实现软负载均衡，而HAProxy和Nginx是基于第三方应用实现的软负载均衡;
LVS是可实现4层的IP负载均衡技术，无法实现基于目录、URL的转发。而HAProxy 和Nginx都可以实现4层和7层技术，HAProxy可提供TCP和HTTP应用的负载均衡综合解决方案；
LVS因为工作在ISO模型的第四层，其状态监测功能单一，而HAProxy在状态监测方面功能更丰富、强大，可支持端口、URL、脚本等多种状态检测方。
HAProxy功能强大，单纯从效率上来讲HAProxy会比Nginx有更出色的负载均衡速度，在并发处理上也是优于Nginx的。但整体性能低于4层模式的LVS负载均衡；
Nginx主要用于web服务器或缓存服务器。Nginx的upstream模块虽然也支持群集功能，但是对群集节点健康检查功能不强，性能没有Haproxy好。对网络带宽要求不高，安装配置简单，不支持session，需要ip_hash和cookie解决保持会话

3.软件安装

3.1 硬件要求

3.2 安装依赖包

yum -y install epel-release gcc systemd-devel

3.3 下载软件源码包

wget https://www.haproxy.org/download/2.6/src/haproxy-2.6.2.tar.gz

或者提前下载好安装包，然后上传服务器指定位置也可以，以下文件是2.8版本的软件包

$HaProxy2.8$ (链接：pan.baidu.com/s/11WAYKPea... 提取码：yqsy)

3.4 解压

tar -zxvf haproxy-2.6.2.tar.gz

3.5 从源码编译 HAProxy 应用

javascript 复制代码

cd haproxy-2.6.2
make clean
make -j 8 TARGET=linux-glibc USE_THREAD=1
make PREFIX=${/app/haproxy} SBINDIR=${/app/haproxy/bin} install  # 将 `${/app/haproxy}` 和 `${/app/haproxy/bin}` 替换为自定义的实际路径。比如/usr/local/haproxy

3.6 重新配置profile文件

bash 复制代码

echo 'export PATH=/app/haproxy/bin:$PATH' >> /etc/profile

. /etc/profile

3.7 检查是否安装成功

which haproxy

至此安装步骤已完成。

4.使用haproxy搭建tidb负载服务

4.1 编写haproxy配置文件，比如haproxy.conf,内容如下

bash 复制代码

global                                     # 全局配置。
   log         127.0.0.1 local2            # 定义全局的 syslog 服务器，最多可以定义两个。
   chroot      /var/lib/haproxy            # 更改当前目录并为启动进程设置超级用户权限，从而提高安全性。
   pidfile     /var/run/haproxy.pid        # 将 HAProxy 进程的 PID 写入 pidfile。
   maxconn     4096                        # 单个 HAProxy 进程可接受的最大并发连接数，等价于命令行参数 "-n"。
   nbthread    48                          # 最大线程数。线程数的上限与 CPU 数量相同。
   user        haproxy                     # 同 UID 参数。
   group       haproxy                     # 同 GID 参数，建议使用专用用户组。
   daemon                                  # 让 HAProxy 以守护进程的方式工作于后台，等同于命令行参数"-D"的功能。当然，也可以在命令行中用"-db"参数将其禁用。
   stats socket /var/lib/haproxy/stats     # 统计信息保存位置。

defaults                                   # 默认配置。
   log global                              # 日志继承全局配置段的设置。
   retries 2                               # 向上游服务器尝试连接的最大次数，超过此值便认为后端服务器不可用。
   timeout connect  2s                     # HAProxy 与后端服务器连接超时时间。如果在同一个局域网内，可设置成较短的时间。
   timeout client 30000s                   # 客户端与 HAProxy 连接后，数据传输完毕，即非活动连接的超时时间。
   timeout server 30000s                   # 服务器端非活动连接的超时时间。

listen admin_stats                         # frontend 和 backend 的组合体，此监控组的名称可按需进行自定义。
   bind 0.0.0.0:8080                       # 监听端口。
   mode http                               # 监控运行的模式，此处为 `http` 模式。
   option httplog                          # 开始启用记录 HTTP 请求的日志功能。
   maxconn 10                              # 最大并发连接数。
   stats refresh 30s                       # 每隔 30 秒自动刷新监控页面。
   stats uri /haproxy                      # 监控页面的 URL。
   stats realm HAProxy                     # 监控页面的提示信息。
   stats auth admin:pingcap123             # 监控页面的用户和密码，可设置多个用户名。
   stats hide-version                      # 隐藏监控页面上的 HAProxy 版本信息。
   stats  admin if TRUE                    # 手工启用或禁用后端服务器（HAProxy 1.4.9 及之后版本开始支持）。

listen tidb-cluster                        # 配置 database 负载均衡。
   bind 0.0.0.0:3390                       # 浮动 IP 和 监听端口。
   mode tcp                                # HAProxy 要使用第 4 层的传输层。
   balance leastconn                       # 连接数最少的服务器优先接收连接。`leastconn` 建议用于长会话服务，例如 LDAP、SQL、TSE 等，而不是短会话协议，如 HTTP。该算法是动态的，对于启动慢的服务器，服务器权重会在运行中作调整。
   server tidb-1 xxxxx:4000 check inter 2000 rise 2 fall 3       # 检测 4000 端口，检测频率为每 2000 毫秒一次。如果 2 次检测为成功，则认为服务器可用；如果 3 次检测为失败，则认为服务器不可用。
   server tidb-2 xxxxx:4000 check inter 2000 rise 2 fall 3       # xxxx为服务器ip

4.2 启动服务

进入到配置文件目录，执行命令

haproxy -f haproxy.conf

如果执行报错，可能是没有创建配置文件中haproxy的用户和组信息，以及/var/lib/haproxy/stats文件，

useradd haproxy

然后创建stats文件

touch /var/lib/haproxy/stats

重新执行haproxy -f haproxy.conf命令即可

4.3 访问服务

http://ip:8080/haproxy

对应的uri和配置文件中保持一致，然后输入用户密码即可

同时可以使用数据库客户端（比如navicat）进行连接，查看能否连接上，ip为服务器ip，端口为3390

4.4 验证负载均衡策略

在haproxy服务器上执行如下命令(前提是安装mysql客户端：命令为 yum -y install mysql，安装成功使用mysql -V命令查看是否成功)，就可以输出查询的是哪个节点实例信息,10.0.0.1换成服务器实际的ip地址

css 复制代码

mysql -uroot -h10.0.0.1 -P 3390 -p -e "select instance from INFORMATION_SCHEMA.CLUSTER_PROCESSLIST where id=(select connection_id());"

4.5 停止服务

killall -9 haproxy

或者使用ps -ef | grep haproxy命令，然后使用kill -9 pid命令