超文本传输协议(HTTP,HyperText Transfer Pritocol)是互联网上应用最为广泛的一种网络协议。所有的网页文件都必须遵守这个标准。设计HTTP最初的目的是为了提供一种发布和接收HTML页面的方法。
1.概念
HTTP协议采用了请求/响应模型。客户端向服务器发送一个请求,请求头包含请求的方法,URL,协议版本,以及包含请求修改符,客户信息和内容的类似于MIME的消息结构。服务器以一个状态行作为响应,响应的内容包括信息协议的版本,成功或者错误编码加上服务器信息,实体元信息以及可能的实体内容。
HTTP已经演化出了很多版本,他们中的大部分都是向下兼容的。
(1)HTTP/0.9已过时。只接受GET一种请求方法,没有在通讯中指定版本号,且不支持请求头。由于该版本不支持POST方法,所以客户端无法向服务器传递太多信息。
(2)HTTP/1.0这是第一个在通讯中指定版本号的HTTP协议版本,至今仍被广泛采用,特别是在代理服务器中。
(3)HTTP/1.1当前版本。持久连续被默认采用,并能很好地配合代理服务器工作。还支持以管道方式同时发送多个请求,以便降低线路负载,提高传输速度。
2.HTTP方法
HTTP支持几种不同的请求命令,这些命令被称为HTTP方法(HTTP method)。每条HTTP请求报文都包含一个方法,告诉服务器要执行什么动作,包括:获取一个页面,运行一个网关程序,删除一个文件等。最常用的获取资源的方法是GET,POST。
HTTP方法 | 描述 |
---|---|
GET | 请求获取Request-URI所标识的资源 |
PUT | 请求服务器存储一个资源,并且Request-RUI作为其标识 |
DELETE | 请求服务器删除Request-RUI所标识的资源 |
POST | 在Request-URI所标识的资源后附加新的数据 |
HEAD | 请求获取由Request-URI所标识的资源的响应消息报头 |
GET方法采用的是URL后缀的形式,比如http://www.test.com/a.php?Id=123就是一个GET请求,服务器接收后可以解析出Id=123。而POST方法不需要在URL中显示"?Id=123",参数作为内容进行隐藏的提交。因此,表单类或者有用户名,密码等内容提交时建议使用POST方法。
GET方法在URL上显示参数,而URL是有长度限制,故不适合提交URL时,浏览器不需要向服务器再次发出请求,直接在本地缓存中获得页面。GET和POST方法对比
GET方法 | POST方法 | |
---|---|---|
对数据长度的限制 | URL的长度是受限制的(URL的最大长度是2048个字符) | 无限制 |
缓存 | 能被缓存 | 不能缓存 |
安全性 | 与POST相比,GET的安全性较差,因为所发送的数据是URL的一部分。在发送密码或其他敏感信息时绝不要使用GET | POST比GET更安全,因为参数不会被保存在浏览器历史或Web服务器日志中 |
历史 | 参数保留在浏览器历史中 | 参数不会保存在浏览器历史中 |
后退按钮/刷新 | 无害 | 数据会被重新提交,浏览器应该告知用户数据会被重新提交 |
书签 | 可收藏为书签 | 不可收藏为书签 |
3.HTTP状态码
HTTP状态码(HTTP Status Code)是用以表示服务器HTTP响应状态的3位数字代码,当浏览器请求某个URL时,服务器根据处理情况返回响应的处理状态。HTTP状态码可以分为5大类.
状态码首位 | 已定义范围 | 分类 |
---|---|---|
1xx | 100-101 | 信息提示 |
2xx | 200-206 | 成功 |
3xx | 300-305 | 重定向 |
4xx | 400-415 | 客户端错误 |
5xx | 500-505 | 服务器错误 |
生产环境常见的HTTP状态码
|--------|--------------------------------------------------------------------|
| 200 OK | 请求成功(其后是对GET和POST请求的应答文档) |
| 301 | 请求的永久页面跳转 |
| 302 | 临时重定向 |
| 304 | 未修改,比如本地缓存的资源文件和服务器上比较时,发现并没有修改,服务器返回一个304状态码,你不用请求该资源,直接使用本地的资源即可 |
| 403 | 禁止访问该页面,服务器拒绝请求 |
| 404 | 服务器无法找到被请求的页面 |
| 500 | 内部服务器错误 |
| 502 | 无效网关 |
| 503 | 当前服务不可用 |
| 504 | 网关请求超时 |
4.HTTP请求流程分析
用户在浏览器输入URL访问时,发起HTTP请求报文,请求中包括请求行,请求头,请求体,服务器收到请求后返回响应报文,包括状态行,响应头,响应体。
(1)请求报文
- 请求行:请求行由请求方法,URL以及协议版本三部分组成
- 请求头:请求头为请求报文添加了一些附加信息,由"名/值"对组成,名和值之间使用冒号分割。
请求头 | 描述 |
---|---|
host | 接受请求的服务器地址,可以时IP:端口号,也可以时域名 |
User-Agent | 发送请求的应用程序名称 |
Connection | 指定与连接相关的属性,如Connection:Keep-Alive |
Accept-Encoding | 通知服务器可以发送的数据的压缩格式 |
Accept-Charset | 通知服务端可以发送的编码格式 |
Accept-Language | 通知服务器可以发送的语言 |
- 空行:请求头部的最后会有一个空行,表示请求头部结束,接下来为请求体,这一行非常重要必不可少。
- 请求体:请求体是请求提交的参数,GET方法已经在URL中指明了参数,所以提交时没有数据。POST方法提交的参数在请求体中
(2)响应报文
-
状态行:状态行由协议版本,状态码,状态码描述三部分组成。
-
响应头:响应头与请求头部类似,为响应报文添加了一些附加信息。
|------------------|----------------------|
| 响应头 | 描述 |
| server | 服务器应用程序软件的名称和版本 |
| Content-Type | 响应正文的类型(是图片还是二进制字符串) |
| Content-Charset | 响应正文的使用的编码 |
| Content-Length | 响应正文的长度 |
| Content-Encoding | 响应正文使用的数据压缩格式 |
| Content-Language | 响应正文使用的语言 | -
空行:响应头部的最后会有一个空行,表示响应头部结束
-
响应体:服务器返回的相应HTML数据,浏览器对其解析后显示页面