HTTP 超文本传送协议

1 超文本传送协议 HTTP

·HTTP 是面向事务的 (transaction-oriented) 应用层协议。

·使用 TCP 连接进行可靠的传送。 定义了浏览器与万维网服务器通信的格式和规则。

·是万维网上能够可靠地交换文件(包括文本、声音、图像等各种多媒体文件)的重要基础。

HTTP 不仅传送完成超文本跳转所必需的信息,而且也传送任何可从互联网上得到的信息,如文本、超文本、声音和图像等。

1.1 HTTP 的操作过程

HTTP 规定:在 HTTP 客户与 HTTP 服务器之间的每次交互,都由一个 ASCII 码串构成的请求和一个类似的通用互联网扩充,即"类MIME (MIME-like)"的响应组成。HTTP 报文通常都使用 TCP 连接传送。

请求一个万维网文档所需的时间:

所需的时间 >= RTT(三报文握手建立 TCP 连接) + RTT(请求和接收文档) + 文档的传输时间 = 2 RTT +文档的传输时间.

用户浏览页面的两种方法:

1.在浏览器的地址窗口中键入所要找的页面的 URL。

2.在某一个页面中用鼠标点击一个可选部分,这时浏览器会自动在互联网上找到所要链接的页面。

1.2 HTTP 的主要特点

·HTTP 使用了面向连接的 TCP 作为运输层协议,保证了数据的可靠传输。

·HTTP 协议本身也是无连接的。

·HTTP 是无状态的 (stateless),简化了服务器的设计,使服务器更容易支持大量并发的 HTTP 请求。

1.3 HTTP/1.1 持续连接

·HTTP/1.1 协议使用持续连接 (persistent connection)。

·持续连接(persistent connection):服务器在发送响应后仍然在一段时间内保持这条连接(不释放),使同一个客户(浏览器)和该服务器可以继续在这条连接上传送后续的 HTTP 请求报文和响应报文。

·只要文档都在同一个服务器上,就可以继续使用该 TCP 连接。

·两种工作方式:

·非流水线方式 (without pipelining)

·流水线方式 (with pipelining)。

1.3.1 非流水线方式

·客户在收到前一个响应后才能发出下一个请求。这比非持续连接的两倍 RTT 的开销节省了建立 TCP 连接所需的一个 RTT 时间。

·缺点:服务器在发送完一个对象后,其 TCP 连接就处于空闲状态,浪费了服务器资源。

所需的时间 >= 2 RTT + page.html 传输时间 + 10 RTT + 10 个文档的传输时间 + 空闲时间.

1.3.2 流水线方式

·客户在收到 HTTP 的响应报文之前就能够接着发送新的请求报文。

·连续的多个请求报文到达服务器后,服务器就可连续发回响应报文。

·使用流水线方式时,客户访问所有的对象只需花费一个 RTT时间,使 TCP 连接中的空闲时间减少,提高了下载文档效率。

所需的时间 >= 1 RTT + 11 个文档的传输时间.

1.4 协议 HTTP/2

·是协议 HTTP/1.1 的升级版本。

1.服务器可以并行发回响应(使用同一个 TCP 连接)。

2.允许客户复用 TCP 连接进行多个请求。

3.把所有的报文都划分为许多较小的二进制编码的帧,并采用了新的压缩算法,不发送重复的首部字段,大大减小了首部的开销,提高了传输效率。

4.向后兼容。

2 代理服务器

·代理服务器 (proxy server) 又称为万维网高速缓存 (Web cache),它代表浏览器发出 HTTP 请求。

·万维网高速缓存把最近的一些请求和响应暂存在本地磁盘中。

·当与暂时存放的请求相同的新请求到达时,万维网高速缓存就把暂存的响应发送出去,而不需要按 URL 的地址再去互联网访问该资源。

使用高速缓存可减少 访问互联网服务器的时延:

·不使用高速缓存的情况:

·使用高速缓存的情况:

3 HTTP 的报文结构

·两类报文

·请求报文:从客户向服务器的请求。

·响应报文:从服务器到客户的回答。

·由于 HTTP 是面向正文的 (text-oriented),因此报文中每一个字段的值都是一些 ASCII 码串,每个字段的长度都是不确定的。

·三个组成部分

·开始行:用于区分是请求报文还是响应报文。

·首部行:说明浏览器、服务器或报文主体的一些信息。可以有多行,也可以不使用。

·实体主体:请求报文中一般不用,响应报文中也可能没有该字段。

3.1 请求报文

·方法:对所请求的对象进行的操作,实际上就是一些命令。 请求报文的类型是由它所采用的方法决定的。

·URL:所请求的资源的 URL。

·版本:HTTP 的版本。

HTTP 请求报文举例:

3.2 响应报文

·版本:HTTP 的版本。

·状态码:服务器操作完成的状态。

·状态码:都是三位数字,分为5大类:

·1xx 表示通知信息,如请求收到了或正在进行处理。

·2xx 表示成功,如接受或知道了。

·3xx 表示重定向,表示要完成请求还必须采取进一步的行动。

·4xx 表示客户的差错,如请求中有错误的语法或不能完成。

·5xx 表示服务器的差错,如服务器失效无法完成请求。

·响应报文中常见到的三种状态行:

·HTTP/1.1 202 Accepted 接受

·HTTP/1.1 400 Bad Request 错误的请求

·Http/1.1 404 Not Found 找不到

·短语:解释状态码。

4 在服务器上存放用户的信息

·万维网使用 Cookie 跟踪在 HTTP 服务器和客户之间传递的状态信息。

欢迎一起学习~

相关推荐
中科岩创几秒前
中科岩创桥梁自动化监测解决方案
大数据·网络·物联网
科技小E11 分钟前
国标GB28181设备管理软件EasyGBS:P2P远程访问故障排查指南(设备端)
网络协议·智能路由器·音视频·p2p
‘’林花谢了春红‘’2 小时前
计算机网络习题(第5章 网络层 第6章 传输层)
网络·计算机网络
哎呦不错哦.2 小时前
简单园区网拓扑实验
网络·智能路由器
hgdlip2 小时前
手机IP地址:定义、查看与切换方法
网络协议·tcp/ip·智能手机
dengjiayue5 小时前
tcp 的重传,流量控制,拥塞控制
网络协议·tcp/ip
咕德猫宁丶7 小时前
探秘Xss:原理、类型与防范全解析
java·网络·xss
黑子哥呢?7 小时前
Linux---防火墙端口设置(firewalld)
linux·服务器·网络
hellojackjiang20118 小时前
开源轻量级IM框架MobileIMSDK的鸿蒙NEXT客户端库已发布
网络·即时通讯·im开发·mobileimsdk-鸿蒙端
WebDeveloper20018 小时前
如何使用美国域名中心US Domain Center和WordPress创建商业网站
运维·服务器·css·网络·html