透明多级分流系统(用户端缓存和负载均衡)

部件考虑

有些设备位于客户端或者网络边缘,能够迅速响应用户请求,避免给cpu和数据库带来压力,比如,本地缓存,内容分发网络,反向代理等。

有些设备处理能力能够线性扩展,易于伸缩,应尽量作为业务主体,如集群能够扩展的服务节点

有些设备对系统有全局性影响,需要时刻保持容错备份,比如服务注册中心,配置中心。

有些是单点设备,比如系统路由,网关,数据库等。

对系统进行流量规划时,应该考虑到部件特性

规划原则

尽量减少单点部件,尽量减少到达单点部件的流量

最简单的系统就是最好的系统

客户端缓存

服务器对于客户端请求的响应中附带一些条件,要求客户端在想要发出相同请求时,先判断是否满足条件,如果满足,就直接使用上一次服务器给予的响应来替代,不必重新访问。

通过不同条件,客户端缓存又分为:强制缓存和协商缓存

强制缓存

比如收到请求的10分钟内有效,那么除了用户主动刷新页面,对于新开窗口,浏览器地址输入,前进,后退均可生效。

HTTP的Header参数实现强制缓存

Expires

Header参数是一个截止时间参数。

问题:

受限客户端时间。

无法描述不缓存。

无法让私有资源不被代理服务器,内容分发网络缓存。

Cache-Control

如果expire和cache-control起冲突,会以cache-control为准。

参数:

  • max-age和s-maxage:缓存有效时间,以秒为单位,s-maxage的s是share的缩写,意味着在CDN,代理中持有缓存的有效时间。
  • public和private:private不允许CDN等缓存。
  • no-cache:不缓存

协商缓存

需要浏览器和服务器协商一次,检查客户端的资源是否过期了,会有另外的开销。和强制缓存是并行运行的。

有两种检查资源是否过期的模式:根据修改时间,根据资源唯一标识是否发生变化。他们都是通过一组成对出现的Header来实现的。

Last-Modified和IF-Modified-Since

服务端返回资源会带上Last-Modified的Header,客户端下一次请求相同资源时,就会带上IF-Modified-Since(即获得资源的Last-Modified),如果服务器发现这段时间没有修改,就返回304/Not Modified,无消息体,从而节省流量。

ETage和If-None-Match

ETage代表资源的唯一标识,相比于Modified更精密,因为modified是秒级。

但是通过哈希算ETage也会消耗资源。

传输链路

基于传输链路的设计原则:

  1. 减少请求数量,因为每个http请求都需要建立tcp连接。
  2. 扩大浏览器的并发请求,现代浏览器一般支持6个对于相同域名的并发请求,通过将资源分布在不同域名上,从而实现并发请求。
  3. 压缩传输

tcp连接复用

HTTP/2支持了每个域名维持一个TCP连接,一个HTTP响应当作一个个流,每个数据帧带有流ID,根据流ID可以在浏览器将数据帧重新组装成一个完整的HTTP响应。

对于小而多的文件,一个tcp好用(HTTP2),但是对于大文件,不如多tcp连接快。

压缩HTTP响应

域名解析是透明多级分流系统中重要的环节

DNS查询"icyfenix.cn"

DNS服务返回一个CNAME,"icyfenix.cn.cdn.dnsv1.com"。

递归查询CNAME,返回"icyfenix.cn"的全部的全国的DNS地址。

典型的 CDN 部署中,第一次 DNS 查询是为了获取 CDN 的 DNS 服务器地址,而第二次 DNS 查询则是通过 CDN 的 DNS 服务器获取实际的 IP 地址,CDN的DNS服务器会根据用户的位置等信息返回最优的CDN服务器地址,它可能是一个也可能是一组。

内容分发网络:CDN

仅从网络传输的角度看,一个互联网系统的速度取决于这四点:

  • 网站服务器接入网络运营商的链路所能提供的出口带宽。
  • 用户客户端接入网络运营商的链路所能提供的入口带宽。
  • 从网站到用户所经过的不同运营商之间的带宽。
  • 从网站到用户的物理链路传输时延。
    除了第二条,其他都可以通过CDN实现。

内容分发:CDN获取源站资源的方式

在DNS服务器的协助下,无论是用户还是服务器,内容分发网络都完全是透明的,在两者不知亲的情况下,由CDN节点接管了用户向服务器发出的资源请求。

这其中的问题就是,CDN节点中必须有用户要的资源,其中包括两个内容"如何获取源资源","如何保证资源是最新的"。

CDN获取源站资源的方式就叫做内容分发。

主要有两种方式:

  • 源站主动分发(Push),预加载。
  • CDN被动回源(Pull)

CDN的应用

CDN能做的事情:

  • 加速静态资源分发
  • 安全防御,如果只使用CDN,而隐藏服务器的IP,恶意攻击就无法触及到服务器。
  • 状态缓存
  • 修改资源的内容,比如可以压缩,修改Header参数等。

负载均衡:就是将进入网关的流量合理分配给多个服务器

经历过"域名"-"CNAME"-"最优CDN地址"(这个是DNS的负载均衡),在网络边缘的CDN才进行负载均衡(这是网关层面的负载均衡)。

无论在网关内部建立了多少层负载均衡,从形式上也只能分为两种:四层负载均衡和七层负载均衡,层是对OSI网络模型来说的。

四层负载均衡(链路层的负载均衡)

修改MAC地址在链路层分流

特点是维持同一个TCP连接。

请求进入负载均衡器中,通过修改请求帧的MAC地址,在局域网内将请求送到服务器,由于帧的用户信息没变,服务器直接对用户响应。

想要实现的话需要服务器写入响应的ip地址和负载均衡器的相同,因为这样用户才能判断是自己发出的那个请求的响应。

IP隧道协议在网络层分流

网关给用户的请求再次封装,目标ip为服务器地址,服务器接收到后进行两次拆包,直接给用户响应。

要求服务器写入响应的ip地址和网关的相同。

通过修改请求的ip让服务器和网关通信,然后网关和用户通信

会带来较大的性能损失

七层负载均衡(应用层)

四层的负载均衡使用的都是一个数据帧,也就是通过修改帧的内容来实现的(即维持一个TCP连接)。

应用层的负载均衡需要网关和用户建立TCP,网关和服务器建立TCP,性能一定比不了四层。

七层代理的强大功能:

  • CDN能做的,它都能做,静态资源缓存,安全防护等等。
  • 更智能化的路由
  • 微服务的治理很多都在七层实现

负载均衡的算法策略

  • 轮询
  • 权重轮询
  • 随机均衡
  • 权重随机
  • 哈希MAC或者IP
  • 测试服务器的响应速度进行均衡
  • 最少连接均衡(通过记录服务器连接数)
相关推荐
时光の尘3 分钟前
C语言菜鸟入门·关键字·float以及double的用法
运维·服务器·c语言·开发语言·stm32·单片机·c
以后不吃煲仔饭16 分钟前
Java基础夯实——2.7 线程上下文切换
java·开发语言
进阶的架构师17 分钟前
2024年Java面试题及答案整理(1000+面试题附答案解析)
java·开发语言
前端拾光者21 分钟前
利用D3.js实现数据可视化的简单示例
开发语言·javascript·信息可视化
程序猿阿伟23 分钟前
《C++ 实现区块链:区块时间戳的存储与验证机制解析》
开发语言·c++·区块链
傻啦嘿哟41 分钟前
如何使用 Python 开发一个简单的文本数据转换为 Excel 工具
开发语言·python·excel
大数据编程之光1 小时前
Flink Standalone集群模式安装部署全攻略
java·大数据·开发语言·面试·flink
初九之潜龙勿用1 小时前
C#校验画布签名图片是否为空白
开发语言·ui·c#·.net
Dola_Pan1 小时前
C语言:数组转换指针的时机
c语言·开发语言·算法
ExiFengs1 小时前
实际项目Java1.8流处理, Optional常见用法
java·开发语言·spring