2.5 - 网络协议 - HTTP协议工作原理,报文格式,抓包实战

「作者主页」:士别三日wyx
「作者简介」:CSDN top100、阿里云博客专家、华为云享专家、网络安全领域优质创作者
「推荐专栏」:对网络安全感兴趣的小伙伴可以关注专栏《网络安全入门到精通》

HTTP协议

HTTP(Hypertext Transfer Protocol)是 「超文本传输协议」,基于B/S架构(Browser/Server,浏览器/服务器模式)通信,用户通过浏览器访问Web服务器产生的网页(文本、图片、视频、音乐等),与服务器进行数据交互。

1、HTTP协议工作原理

HTTP协议是基于TCP实现的请求响应-响应协议,工作分为四个过程:

  1. 三次握手「建立TCP连接」
  2. 客户端发送「请求」
  3. 服务端发送「响应」
  4. 四次挥手「关闭TCP连接」

工作过程从HTTP的数据包中可以很好地体现出来

协议本质上就是一个约定俗称的规范,而HTTP协议就规定了浏览器需要如何从服务器请求Web页面、服务器需要如何把Web页面传送给客户端。

  • 浏览器向服务器请求Web页面需要使用「HTTP请求报文」
  • 服务器吧Web页面传送给客户端需要使用「HTTP响应报文」

2、HTTP协议报文

  • 请求报文分为三个部分:请求行、请求头、请求体
  • 响应报文分为四个部分:状态行、响应头、响应空行、响应体

HTTP请求报文的数据包如下

  • 请求行:【固定格式】包含请求方法、请求URL、HTTP版本
  • 请求头:包含请求的客户端的信息,一行一个请求头
  • 请求体:请求的数据部分

HTTP响应报文的数据包如下

  • 状态行:【固定格式】包含版本和响应状态码、状态信息
  • 响应头:包含响应的服务器的资源信息,一行一个响应头
  • 响应空行:用来间隔/区分响应头和响应体
  • 响应体:服务器响应的内容,通常是一个HTML页面的代码或者给客户端的数据。

3、HTTP请求方法

HTTP请求报文的 Request Method表示请求方法(面试常问),不同的方法可以实现不同的获取数据的操作

  • GET:获取数据
  • POST:传递数据,常用于表单提交或上传文件
  • PUT:获取文件资源
  • HEAD:获取报文首部
  • DELETE:删除文件
  • OPTIONS:询问支持的方法(HTTP服务器并不是所有方法都必须实现,但起码要实现GETHEAD方法)
  • TRACE:回显服务器收到的请求,常用于测试
  • CONNECT:要求用隧道协议连接代理,比如SSL加密
  • HTTP服务器扩展其他自定义的方法

GET和POST请求的区别主要体现在三个方面,首先是作用,两个请求的设计理念就不一样:

  • get主要用在查询操作,用来获取资源。
  • post主要用在增删改操作,用来传递数据。

然后是安全性:

  • get请求的参数拼接在url后面,受到url的长度限制,但前端直接就能看到参数的内容,不安全。
  • post请求的参数放在请求体里面,没有大小限制,前端不能直接看到参数的内容,比get要安全一些。

还有缓存和刷新机制:

  • get请求可以被浏览器缓存,并且刷新没有影响。比如同样的请求,第一次请求是200,第二次请求就是304,直接查缓存。
  • post请求不能缓存,每次都会请求到服务器才能响应;如果刷新的话,会重新提交一次数据。

4、HTTP响应状态码

HTTP响应报文的 Status Code 表示响应状态码,用来判断请求成功/失败的原因。

常见的响应状态码:

  • 200 OK:请求成功
  • 304 Not Modified:访问了缓存,短时间重复访问同一个页面,会直接去缓存,而不再请求服务器。
  • 403 Forbidden:没有权限,请求的页面被禁止访问
  • 404 Not Found:路径错误,服务器找不到被请求的页面
  • 500 Internal Server Error:后端代码报错了,请求未完成。服务器遇到不可预知的情况。

完整的状态码如下:

1xx 请求信息

2xx 请求成功

3xx 请求被重定向

4xx 客户端错误

5xx 服务器错误

5、HTTP请求头

HTTP请求的中间部分就是请求头,一行一个,每个请求头的字段都有不同的作用,按需使用。

  • Host:服务器的IP+端口,用来寻找目标服务器。
  • Content-Length:请求体的长度,没有请求体就没有这个字段。
  • Content-Type:请求体的格式,接收方按照这个格式解析。
  • User-Agent:客户端的浏览器版本,接收方按照这个调整返回的内容。
  • Referer:源URL,接收方可以验证请求的来源,防止恶意请求。
  • Cookie:存储在浏览器本地的一些数据,比如账号密码可以用来免登陆。
  • Accept:浏览器可接受的MIME类型
  • Connection:是否需要长链接,Keep-Alive:使用,colse:关闭。
  • X-Forwarded-For:源IP,接收方可以追溯请求的源IP,防止恶意请求。
相关推荐
美味小鱼7 分钟前
Rust枚举(Enum)完全指南:用类型安全表达多样性
开发语言·安全·rust
m0_7471245321 分钟前
用QT做一个网络调试助手
网络·qt·php
007php00733 分钟前
HTTPS域名443端口证书到期问题排查与解决
开发语言·网络·网络协议·计算机网络·http·golang·https
我的运维人生1 小时前
安全漏洞扫描与修复系统的高质量技术详解
网络·安全·web安全·运维开发·技术共享
佛州小李哥1 小时前
在亚马逊云科技上用Stable Diffusion 3.5 Large生成赛博朋克风图片(上)
人工智能·科技·ai·语言模型·stable diffusion·aws·亚马逊云科技
东锋1.32 小时前
深度解析近期爆火的 DeepSeek
人工智能·深度学习
爱研究的小牛2 小时前
讯飞智作 AI 配音技术浅析(二):深度学习与神经网络
人工智能·深度学习·神经网络·机器学习·aigc
Luzem03192 小时前
使用PyTorch实现逻辑回归:从训练到模型保存与性能评估
人工智能·pytorch·逻辑回归
灵封~2 小时前
自定义数据集 使用paddlepaddle框架实现逻辑回归
机器学习
灵封~2 小时前
自定义数据集 使用pytorch框架实现逻辑回归并保存模型,然后保存模型后再加载模型进行预测,对预测结果计算精确度和召回率及F1分数
人工智能·深度学习