目录
一,概述
1,集群概述
集群是一组互相独立的,通过高速计算机网络互联的计算机,它们构成了一个组,并以单一系统的模式加以管理,一个客户和集群互相作用时,集群更像是一个独立的服务器计算机集群是一种计算机系统,它通过一组松散集成的计算机软件/硬件连接起来高度紧密的协作完成计算工作,在某种意义上,它们可以被看作是一台计算机,集群系统之内的单个计算机通常称为节点,通常通过局域网连接,但也有另外的可能连接方法,集群计算机通常用来改进单个计算机的计算速度和可靠性
计算机集群cluster,可以把多台计算机连接运用,平分资源和互为保障集群之内的每个计算机被称为一个节点,节点可添加可减少,这些节点之上虚拟出一台计算机供用户运用,从用户的角度看是一台计算机,无所谓多少节点
特点:高性能,高性价比,可扩展性,高可用性,负载均衡,错误恢复,透明性,可管理性,可编程性
集群类型
负载均衡集群:集群之内的所有节点都处于活动状态,它们分摊系统的工作负载,一般web服务器集群,数据库集群和应用服务器集群都属于这种类型,负载均衡集群一般用于网络需要的网页服务器,数据库服务器,这种集群可以再接到需要时,检查不繁忙的服务器,并把需要转到这些服务器上,从检查另外的服务器状态这一点上看,负载均衡和容错集群很接近,不同之处是数量上更多,load balancing负载均衡,不同节点之间互相独立,不共享任何资源,通过一定算法将客户端的访问需要平分到集群的各个节点上,充分利用每个节点的资源,负载均衡扩展了网络设备和服务带宽,增加吞吐量,增加网络数据处理能力,每个节点的性能和配置可能不同,根据算法,可以分配不同的weight到不同节点上,以实现不同节点的资源利用
高可用集群:常见的就是两个节点做成的HA集群,高可用集群解决的是保障用户的应用程序对外提供服务的能力,主要用于高可用解决方案的实现,节点间以主备形式,,实现容灾;在大型故障的状态下实现快速恢复,快速提供服务,高可用集群的另外一个特点是共享资源,多个节点共享一个存储资源,该存储可在不同节点之间转移
高可用集群可实现三种方式
主从方式:主机工作,备机监控,此方式不能有效利用服务器资源
互为主从:两服务器同时在线,一台服务器故障可转换到另一台上,此方式有效的利用服务器资源,但当服务器故障的时候,将导致一台服务器上运行多个业余
多台服务器主从:大部分服务器在线运用,小部分监控,若有部分服务器故障,可转换到指定的小部分服务器上,此方式为两种方式的综合,多台服务器集群也增加了管理的复杂度
科学计算集群:高性能计算集群,简称HPC集群,这类集群致力于提供单个计算机所不能提供的计算能力
并行计算或称平行计算是相对于串行计算,并行计算的能力的目的是提高计算速度
并行计算分为时间计算和空间计算时间计算即是一个处理器分为多个单元,每个单元负责不同任务,这些单元可并行计算,空间计算利用多个处理器并发的执行计算,高性能计算集群采用将计算任务分配到集群的不同计算节点提高计算能力,这类集群通常运行特定的程序以发挥并行能力,这类程序一般应用特定的运行库,HPC集群特别适合在计算之内各计算机节点之间发生大量数据通讯的计算作业
负载均衡技术类型
四层负载均衡处理器:也称四层交换机,主要通过分析IP层及TCP/UDP层的流量实现基于IP加端口的负载均衡
七层负载均衡器:也称七层交换机,位于OSI的最高层,即应用层,此负载均衡器支持多种协议,七层负载均衡器可根据报文内容,配合一定的负载均衡算法来选择后端服务器
2,LVS介绍
为了克服服务器的过载压力问题,有两种解决方案:单服务器解决方案,即将服务器升级到性能更高的服务器,但是当需要增加时,将很快过载,因此必须再次进行升级,升级过程复杂且成本高,多服务器解决方案,即在服务器集群上构建可扩展的网络服务系统,当负载增加时,可以简单的在集群之内添加新服务器和更多服务器以满足不断增长的需要,因此,构建用于网络服务的服务器集群系统更具可伸缩性,并且更具成本效益
3,LVS和nginx差别
LVS比nginx具有更大的抗负载能力,性能更高,对内存和cpu资源消耗低
LVS工作在网络层,具体流量由操作系统内核进行处理,nginx工作在应用层,可针对http应用实施一些分流策略
LVS安装配置比较复杂,网络依赖性较大,稳定性高,LVS不支持正则表达式,不能实现动静分离操作
LVS运用的协议范围广,nginx仅支持HTTP,HTTPS,Email协议,运用范围小
4,LVS有关术语
DS:director server,指的是前端负载均衡节点
RS:real server,后端真实的工作服务器
VIP:向外部直接面向用户需要,作为用户需要的目标的IP地址
DIP:director server IP,主要用于和内部主机通讯的IP地址
RIP:real server IP,后端服务器的IP地址
CIP:client IP,访问客户端的IP地址
5,LVS负载均衡算法
rr:轮询是最简单的负载均衡方法,按照预定的顺序,轮流将需要分配给后端服务器
wrr:类似于轮询,但是每个后端服务器可以设置一个weight,表示处理能力,weight高的服务器将接收更多的需要
sh:根据需要的源IP地址,通过散列函数计算出一个槽位,将需要分发到对应的服务器
dh:与源地址散列算法相反,是根据需要的目标IP地址来进行散列分发的
lc:哪个服务器的当下的活跃连接最少,就将新的需要分配给它
wlc:谁的结果最小,就分配给谁
二,IPVS模块概述
1,IPVS的介绍
IPVS基本上是一种高效的layer-4交换机,提提供负载平衡的功能,当一个TCP链接的初始SYN报文到达时,IPVS就选择一台服务器,将报文转发给它,此后通过查看报文的IP和TCP报文头地址,保证此链接的后继报文被转发到相同的服务器,这样,IPVS不用检查到需要的内容再选择服务器,这就需要后端的服务器组是提供相同的服务,不管需要被送到拿一台服务器,返回结果都应该是一样的,但是在有一些应用之内后端的服务器可能功能不一,有的提供HTML文档的web服务器,有的提供图片的web服务器,有的是提供CGI的web服务器,这是,就需要基于内在需要分发,同时基于内在需要分发可以提高后端服务器上访问的局部性
2,IPVS的工作原理
IPVS是LVS的关键,因为LVS的IP负载均衡技术就是通过IPVS模块来实现的,IPVS是LVS集群系统的核心,它的主要作用是:安装在director server上,同时在director server上虚拟出一个IP地址,用户必须通过这个虚拟IP地址访问服务,这个虚拟IP一般称为LVS的VIP,访问的需要首先经过VIP到达负载调度器,再有负载调度器从real server列表之内选择一个服务节点响应用户的需要,LVS的本身分成了两个部分,第一部分是工作在内核空间的一个IPVS的模块,LVS的功能都是IPVS模块实现的,第二部分是工作在用户空间的一个用来定义集群服务的一个工具ipvsadm,这个工具的主要作用是将管理员定义的集群服务列表传送给工作在内核空间之内的IPVS模块
打赏链接:
