HTTP / HTTPS详细介绍

HTTP / HTTPS

HTTP概念
HTTP协议格式
HTTP请求
- URL
- 方法(method)
- 请求报头
- - Host
  - [Content - Length](#Content - Length)
  - [Content - Type](#Content - Type)
  - User-Agent
  - Referer
  - Cokie
HTTP响应
- 状态码
- 响应报头
HTTPS

HTTP概念

HTTP被称为超文本传输协议，文本是字符串 ，超文本也就是能传输的不仅仅是文本，也可以是一些图片、视频等等，其可以传输二进制数据

HTTP是目前主流的一种应用层协议

这里HTTP1.0 、HTTP1.1 、HTTP2.0都是基于TCP实现的，但是HTTP3.0是基于UDP实现的(因为TCP比较有些影响性能)

使用https://www.bilibili.com/ 打开网页，但是发现这里并不是http，而是https,其本质上还是http，只是在这个基础上，引入了"加密层 "，能够实现"安全传输 "

当输入这个网址的时候，浏览器就会可能给服务器发送多个HTTP请求 ，服务器就会对应返回多个响应 ，像这里的界面 html、css、javaScript，还有一些图片、文字等信息

HTTP是典型的一问一答的模型，客户端发一个请求，服务器就发一个回应

像访问一个网站时候，可能涉及多个HTTP请求/响应

HTTP协议格式

HTTP是一个文本格式的协议，可以通过一些工具进行抓包，这里Fiddler工具比较适合HTTP抓包

配置一下
抓取访问搜狗浏览器的这个包

此时这里的Fiddler相当于一个代理，浏览器先把请求发给Fiddler，Fiddler再将请求发送给sogou服务器，并且返回数据，也是先给Fiddler，再返回给浏览器，因此有时候可能因为抓包工具导致请求一些东西超时

协议格式

请求首行：方法 + url + 版本

响应首行：版本号 + 状态码 + 状态解释器

如果没有这个空行，可能回出现"粘包问题"

HTTP请求

URL

Uniform Resource Locators统一资源定位符

在这个互联网上每一个文件都有一个唯一的URL，里面会指出文件位置以及浏览器如何处理等等，URL的格式是被约定了

http :协议方案名 ，有http 、 https等，也有其他类型
user : pass : 登录信息 ，但是现在都是采用一个界面方式输入登录信息，所以这个可能被省略
www.example.jp : 服务器地址 ，可以是域名，也可以是IP地址 ，通常使用域名
80 ：是服务器端口号 ，如果没填浏览器会给一个默认的，http默认80，https默认443
dir / index.htm : 带层次的文件路径 ，通过一定的目录结构来组织资源，这里可能是真实的目录结构，也可能是"虚拟的目录结构"
uid = 1 ：查询字符串(query string)本质是键值对结构，&分割键值对，=分割键和值
#ch1 ：片段表示符，用于页面跳转，一个页面的不同部分

query string键值对结构，里面的key和val是由程序猿决定的
片段标识符

在Vue里有展示

URL encode

对于query string 来说，有时候需要进行encode转码

一些特殊字符，像 / ? :等这样的字符，在这里面是有特殊的含义，这样字符不可以随意出现，因此需要对这些字符进行转义，中文字符也是需要进行转义的

转义规则 ：将转码字符转换成16进制，从右向左取出4位进行处理(不足的话直接取)，两位作为一位，在其前面加 %

像这里 + 转义成 %2B

urldecode就是解码，urlencode是编码query string获取数据

方法(method)

GET获取 ：就是从服务器上获取某个资源
POST投递 ：将数据投递到服务器上
PUT放过去 ：将数据往服务器上投递
DELETE删除 ：删除服务器上资源

............

虽然这里有每个方法都有自己的含义，但是这并不是强制要求，因此这里GET方法是最常用的

GET方法

GET常用于HTTP方法，常用于获取服务器的某个资源

GET请求通常是没有body (存放的一些程序猿自己定义的一些数据)的，但是也可以有

query string 可以为空，也可以不为空

header部分有若干键值对结构

例如访问搜狗浏览器

此时想要获取某个数据可以通过url中的信息，获取其路径和其query string

POST方法

用户输入数据给服务器

query string 一般为空，也可以不为空

header有若干键值对结构

body一般不为空

登录和上传文件容易出现POST
登录login

上传文件更改头像

GET和POST的区别

没有"本质区别"，能用于GET的地方一般也能用于POST，能用POST的地方一般也能用GET

1.GET一般用于获取数据，POST一般用于上传数据

2.GET通常将要传输的数据放入query string中(body一般为空)，POST通常放在body中(query string一般为空)

还有一些有歧义的说法

1.幂等：GET请求一般实现"幂等 "，POST请求"没有幂等 "

幂等在计算机意思就是如果这个请求重复产生之后，其结果是明确的，这就称为幂等

反之就是都是GET相同，但是返回内容不同就是没有幂等

在官方文档中只是建议这样设置 ，但是并没有强制要求

2.GET可以被缓存，POST不可以被缓存

这里和上面幂等一样，之所以其会相同请求，出现相同结果，是因为其对着一些数据进行了缓存，反之则没有

3.安全：GET请求不安全，POST请求安全

像前面的登录，如果是GET的话会将这些信息放在query string会直接显示出来

POST会将这些登录信息放在body中

并不是展示出来就不安全，没展示出来就安全，还是安不安全取决于你是否对这些数据进行加密

4.传输数据量：GET传输的数据量⼩,POST传输数据量⼤

以前的浏览器对起url有长度限制，但是现在的URL可以很长 ，这里主要取决于不同浏览器和服务器的实现区别

5.数据传输类型：GET请求只能传输文本数据，POST可以传输文本和二进制文件
URL中的确不可以直接放二进制，但是起可以通过urlencode / base64转成文本来进行传输

其他方法

PUT和POST类似，只是具有幂等建议

DELETE删除服务器数据指定资源

OPTIONS返回服务器所支持请求方法

HEAD和GET类似，只不过之响应之后，只返回头

TARCE回显服务器端收到的请求

CONNECT预留，暂不使用

请求报头

Host

表示服务器主机的地址和端口号

此处把域名中的IP地址和端口号拿出来，这样如果后面需要就可以直接使用

Content - Length

body的长度以字节为单位

Content - Type

表示的是body的格式

常见的格式有 text / html 、text / css 、application / javascript 、application/json、image / peg 、text / plain

这里告诉浏览器/服务器数据格式，这样服务器 / 浏览器知道如何解析这些数据

Content-Type:charset=utf-8这样可以设置起字符集编码，如果一些数据出现乱码就可能使编码方式不同的问题

User-Agent

表示浏览器和操作系统的属性

例如：这里访问搜狗浏览器

User-Agent: Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/141.0.0.0 Safari/537.36 Edg/141.0.0.0

浏览器会不断更新，但是仍然会有一些人使用一些老版本，因此这里可以通过这个操作系统信息 + 浏览器版本 ，知道版本就可以根据其对应版本可以接收的信息，针对性返回信息(一些新的版本功能可能比老版本强)

并且我们这里PC端和手机端，因为屏幕大小的问题，其需要判断其操作系统进行浏览器显示对应不同显示，但是这样就有问题就是如果更新新的版本就要两端都要更新

手机端

wap.sogou.com

PC端

www.sogou.com

因为这样会更新两个版本的问题，现在有"响应式编程 "，就是可以根据浏览器窗口尺寸来进行不同的排版更换

Referer

表示的这个界面从那个界面跳转过来的

搜狗浏览器搜时崎狂三

Referer: https://www.sogou.com/
搜索结果点击相对应链接

Referer: https://www.sogou.com/web?query=时崎狂三\&_asf=www.sogou.com\&_ast=\&w=01019900\&p=40040100\&ie=utf8\&from=index-nologin\&s_from=index\&sourceid=9_01_03\&sessiontime=1760885330015

直接从浏览器中输入url是或者根据收藏夹访问页面是没有Referer

Cokie

存储的是一个字符串，可能是客户端通过网页自动写入的，也可能来自服务器经过响应写入的

用途：浏览器给网页提供的本地存储数据的方案
从哪里来 ：服务器返回
如何存 ：按照字符串进行存(键值对)进行存储，根据域名维度进行划分
存哪里 ：本地存储之后，后续访问同一域名的网站，就会把cookie的内容通过请求报头，传输给服务器

像这里在gitee网站中

并且这里可以对其Cookie进行删除

如果删除，下一次登录访问时候，其会Set-Cookie 将保存的Cookie传递过去

很多场景都是基于Cookie实现的，最核心功能是保存用户登录状态

Coolie和Session不是强相关的

即使是上面的登录场景
客户端但可以使用其他技术搭配Session，当然Cookie也可以有其他功能

HTTP响应

状态码

200：OK请求成功
404 NOT FOUND没找到，访问一个资源的时候在浏览器输入URL如果输入错误，可能就会出现这样的回应

403 Forbidden

表示拒绝访问，通常是一个用户需要具有一定权限才能访问

(像这里查看别人的gitee私有仓库,只有登录了账号才可以访问)

405 Method Not Allowed

HTTP有GET POST PUT DELETE等方法，但是并不是所有浏览器都有其全部方法，如果访问其没有的方法就会出现这个服务器不支持这个方法
500 Internal Server Error

服务器挂了，内部出现了问题
504 Gateway Timeout

服务器网关业务繁忙，出现了请求超时的问题
301Moved Permanently 永久重定向
302Move temporarily 临时重定向
"重定向"相当于跳转 ，我们访问url1,它跳转到了url2

跳转的话响应报头header部分会包含一个Location，表示跳转到了那个页面

永久重定向就会访问到这种响应，后续请求都会自动改成新地址，和302类似需要通过Location