系列文章目录
什么是计算机网络?
什么是网络协议?
计算机网络的结构
数据交换之电路交换
数据交换之报文交换和分组交换
分组交换 vs 电路交换
计算机网络性能(1)------速率、带宽、延迟
计算机网络性能(2)------时延带宽积、丢包率、吞吐量/率
计算机网络体系结构概念
OSI参考模型基本概念
OSI参考模型中非端-端层(物理层、数据链路层、网络层)功能介绍
OSI参考模型中端-端层(传输层、会话层、表示层、应用层)功能介绍
TCP/IP参考模型基本概念,包括五层参考模型
网络应用的体系结构
网络应用进程通信
网络应用对传输服务的需求
Web应用之HTTP协议(涉及HTTP连接类型和HTTP消息格式)
Cookie技术
功能
Web缓存/代理服务器技术能够在不访问服务器的前提下满足客户端的HTTP请求。
也就是说如果我们有一个代理服务器,那我们上网看到的页面可能都不是原服务器提供的,而是由代理服务器提供。
Web缓存/代理服务器技术解决了什么问题?
那为什么要发明这种技术?是为了解决性能上的问题。前面的cookie是解决功能上的问题。也就是说,cookie实现了新的功能,而Web缓存/代理服务器技术是优化了性能。那它能够改善哪些性能呢?
- 缩短客户请求的响应时间。用户的感觉就是网速快。
- 减少机构/组织的流量。
- 在大范围内(Internet)实现有效的内容分发。
如何实现?
结构如下:
在客户和服务器之间架设代理服务器,然后用户设定浏览器访问缓存或代理服务器。也就是说浏览器的所有请求都发给了缓存/代理服务器,而不是直接发给原始服务器。那这里就有两种情况:
- 如果缓存/代理服务器中有用户所请求的对象,那就直接返回了;
- 如果没有,缓存/代理服务器就向原始服务器发送HTTP 请求,获取对象,然后把返回给客户端同时保存该对象。
所以缓存/代理服务器既充当客户端,也充当服务器。
缓存/代理服务器一般由组织或ISP(Internet服务提供商)来架设。
示例
机构内部有一个局域网,速率是10Mbps,机构的局域网接入互联网,速率是1.5Mbps,原始服务器都在互联网上。
假定:
- 对象的平均大小=100,000比特(100KB)
- 机构网络中的浏览器平均每秒有15个到原始服务器的请求
- 从机构路由器到原始服务器的往返延迟=2秒
网络性能分析:
-
每秒有15个请求,每个请求的对象大小是100KB,那一秒的总的请求消息大小是15*100KB=1.5MB
-
局域网(LAN)的利用率=15%(1.5/10)。
-
接入互联网的链路的利用率=100%(1.5/1.5)。当一条链路的利用率接近100%一位着巨大的时间延迟。
-
总的延迟 = 互联网上的延迟+访问延迟+局域网 延迟
=2秒+几分钟+几微秒
可以看到这种情况下的时间延迟是非常大的。
解决方法有:
-
花钱升级及机构局域网接入互联网的带宽,从1.5Mbps升级为10Mbps。问题是成本太高。
-
尝试Web缓存或代理服务器。在机构内部增加一个缓存/代理服务器。假定缓存命中率是0.4。
网络性能分析:
- 40%的请求立刻得到满足
- 60%的请求通过原始服务器满足
- 接入互联网的链路的利用率下降到60%,从而 其延迟可以忽略不计,例如10微秒
- 总的平均延迟=互联网上的延迟+访问延迟+局 域网延迟=0.6×2.01秒+0.4×n微秒 < 1.4
问题是如何保证代理服务器和原始服务器的数据是否是一致的。这个靠HTTP里的条件性GET方法。
条件性GET方法
目标:如果缓存/代理服务器有最新的版本,则不需要发送请求对象。
那怎么做呢?
缓存/代理服务器在HTTP请求消息中声明所持有版本的日期 。服务器收到之后进行检查,如果如果缓存的版本是最新的,则响应消息中不包含对象,并且响应状态码为304代表没有改变;如果改了就把新的对象发给他,并放回200状态码。
这样意味着当客户访问缓存的时候,缓存有必要利用条件性GET方法向服务器发起请求,当没有发生改变的时候就节省了带宽。这样就解决了前面提到的内容是不是最新、是不是一