应用层协议——http

文章目录

  • [1. HTTP协议](#1. HTTP协议)
    • [1.1 认识URL](#1.1 认识URL)
    • [1.2 urlencode和urldecode](#1.2 urlencode和urldecode)
    • [1.3 HTTP协议格式](#1.3 HTTP协议格式)
      • [1.3.1 HTTP请求](#1.3.1 HTTP请求)
      • [1.3.2 HTTP响应](#1.3.2 HTTP响应)
      • [1.3.3 外网测试](#1.3.3 外网测试)
      • [1.3.4 添加html文件](#1.3.4 添加html文件)
      • [1.3.5 HTTP常见Header](#1.3.5 HTTP常见Header)
      • [1.3.6 GET和POST](#1.3.6 GET和POST)
    • [1.4 HTTP的状态码](#1.4 HTTP的状态码)
      • [1.4.1 301和302](#1.4.1 301和302)
      • [1.4.2 代码实现](#1.4.2 代码实现)
    • [1.5 Cookie](#1.5 Cookie)
      • [1.5.1 代码验证](#1.5.1 代码验证)
      • [1.5.2 Cookie+session](#1.5.2 Cookie+session)
    • [1.6 Connection](#1.6 Connection)

1. HTTP协议

虽然我们说,应用层协议是我们自己定的,但实际上,已经有一些现成的,又非常好用的应用层协议,供我们直接参考使用。HTTP(超文本传输协议)就是其中之一。

1.1 认识URL

平时我们俗称的 "网址" 其实就是说的 URL:

这里的登录信息现在已经隐藏起来,改成例如手机登录、微信登录等方式。

这里服务器地址也叫做域名会被转换成IP,并且访问网络服务,服务端必须具有端口号。因为网络通信的本质:IP+prot。但是使用确定协议的时候,一般会缺省端口号。所以,浏览器访问指定的URL的时候,浏览器必须给我们自动添加prot。

那么浏览器是如何得知,URL匹配的prot是哪个呢

特定的众所周知服务,端口号是确定的。http对应的是80,https对应的是443,sshd对应的是22。

那么http是做什么的呢

像我们查看图片,观看视频,其实都是以网页的形式呈现的,也就是.html文件,既然是文件,那么客户端想要观看视频时就是发送请求到服务器,然后服务器就会打开文件再给客户端发送过来。

那么http就是向特定的服务器申请特定的"资源",获取到本地,进行展示或使用

那么资源文件在LInux服务器上,我们要打开,读取,发送给客户端,前提是要找到这个文件,找一个文件靠的就是路径,所以在URL中包含了路径。/就是Linux下的路径分隔符。

1.2 urlencode和urldecode

像 / ? : 等这样的字符,已经被url当做特殊意义理解了,因此这些字符不能随意出现。比如:某个参数中需要带有这些特殊字符,就必须先对特殊字符进行转义。

转义的规则如下:将需要转码的字符转为16进制,然后从右到左,取4位(不足4位直接处理),每2位做一位,前面加上%,编码成%XY格式

比如:

这里"+" 被转义成了 "%2B"。

1.3 HTTP协议格式

1.3.1 HTTP请求


请求行里对应的是:请求方法 资源路径 http的版本

请求报头对应的是:key:空格value

读到空行就代表前面的请求行和请求报头都读取完了。

1.3.2 HTTP响应

响应和请求一样是4个结构。

1.3.3 外网测试

如果我们想让浏览器去访问我们的云服务器,我们要先开放我们的端口,这里每个服务器开放我们的端口不一样,大家需要自己去上网搜索一下。

首先,这里只有服务器的编译,没有客户端。

这里服务器也是简单的多进程版本,我们让孙子进程去执行这个服务。

执行的服务是先把对方的请求信息打印出来,然后再做出响应。

当我们在浏览器链接这个IP时,可以看到浏览器上打印出我们的有效载荷。然后服务器也收到了对应的请求信息。

下面我们继续测试:

先让服务器起来。

这里我们安装了telnet命令,它是远程按照某种协议去登录。只要显示'^]'就代表我们登录成功了,然后Ctrl+]:

然后再回车一下,就可以发送我们的请求。

1.3.4 添加html文件

我们创建一个wwwroot文件夹来保存我们网页的信息。

这里就保存我们网页的首页信息。那么我们如何把这个文件读取出来,并添加相应的报头信息呢?

那么第一个问题就是:文件在哪里
在前面的演示中,我们知道在请求的请求行中,第二个字段就是你要访问的文件路径

但是这里的第一个/不是根目录,它是web根目录,但是可以设置成根目录。

那么如果我们不想把/a设置成根目录,我们可以在前面加上前缀:

bash 复制代码
    path = "/a/b/index.html";
    recource = "./wwwroot"; // 我们的web根目录
    recource += path; // ./wwwroot/a/b/index.html

下面我们就写一个获取请求行文件路径的方法:

如果请求的只有一个/,说明访问的就是web根目录,难道需要把web根目录下的所有文件都返回,这是不可能的,所以我们把首页信息返回。

获取到文件路径后,我们需要把web根目录添加上:

添加完成之后,我们就可以打开文件并去读取。

读取之后,返回。

顺便,我们记录一下文件的类型。

在这里我们可以添加报头:内容的类型和内容的长度。

Content-Type(内容类型),一般是指网页中存在的 Content-Type,用于定义网络文件的类型和网页的编码,决定浏览器将以什么形式、什么编码读取这个文件

如果文件里的后缀不是.jpg类型,我们就把Content-Type设置成text/html : HTML格式(HTML是一种纯文本格式的文件,内部只能书写文字内容,不能添加图片、音频、视频)。

如果文件里的后缀是.jpg类型,我们就把Content-Type设置成image/jpeg :jpg图片格式("JPG是JPEG格式文件,JPEG格式是最常用的图像文件格式,后缀名为".jpg"或".jpeg")。

测试结果:

1.3.5 HTTP常见Header

Content-Type: 数据类型(text/html等)。
Content-Length: Body的长度。
Host: 客户端告知服务器, 所请求的资源是在哪个主机的哪个端口上。
User-Agent: 声明用户的操作系统和浏览器版本信息。
referer: 当前页面是从哪个页面跳转过来的

location: 搭配3xx状态码使用, 告诉客户端接下来要去哪里访问。
Cookie: 用于在客户端存储少量信息. 通常用于实现会话(session)的功能

1.3.6 GET和POST

网络行为无非两种:
1.把远端的资源拿到本地,采用的是GET方法。
2.把我们的属性字段提交到远端,采用的是GET方法或者POST方法

下面我们就试着把我们的属性字段提交到远端:

我们在这里创建了一个表单,action属性规定当提交表单时,向何处发送表单数据。 method属性是规定如何发送表单数据(表单数据发送到action属性所规定的页面)。

然后我们点击按钮,就会出现404,因为我们找不到/a/b/c.html,所以就报错404:

下面我们看一下它的抓包情况:

从上图可以看出:在HTTP中,GET方法会以明文方式将我们对应的参数信息拼接到URL中

下面我们再看一下POST方法:

测试输入:

可以看到URL中,没有我们的参数信息。

看一下它的抓包情况:

从上图可以看出:POST方法提交参数,会将参数以明文的方式拼接到HTTP正文中来进行提交

所以,两者方法的比较,GET方法传参不私密,POST方法传参通过正文传参,相对来说私密点。并且如果我们传的资源比如视频,音乐这些比较大的不采用GET方法,否则URL会非常长。

1.4 HTTP的状态码

最常见的状态码, 比如 200(OK), 404(Not Found), 403(Forbidden), 302(Redirect, 重定向), 504(Bad Gateway)。

1.4.1 301和302

301叫做永久重定向,302叫做临时重定向
这里的重定向是什么意思呢

我们客户端向服务器进行请求,它给客户端响应,响应中的状态码如果为301或者302,那么它的响应报头里有location:一个新的网站(new url)。

那么我们的浏览器就会自动的跳转到new url这个服务端。这个过程就是重定向。

1.4.2 代码实现

我们这里读取到请求之后,服务器不做响应,让它重定向。

大家可以这样去测试一下,你会发现它会跳转到qq的网页。这里我们写Location时需要加上域名,不然只能站内跳转。

http协议的特点之一:无状态,意思是:http不会记录你上一秒的请求

那么肯定会有许多人有疑问?假如我们是某个网站的VIP,我们想看一部电影,我们肯定要先登录我们的VIP,如果我们不记录,那么每访问一部电影,我们就登录一次VIP吗?

答案肯定不是的,虽然http没有记录,但是我们却有保持记录的手段,所以就需要用到Cookie(会话保持)。

比如:我们登录时需要输入我们的用户名和密码,给服务端请求响应后,服务器会把我们输入的内容写到客户端的Cookie中。等下次再次请求时,会自动携带浏览器访问该网站对应的Cookie文件中的内容。

1.5.1 代码验证

我们要设置Cookie,需要使用一个响应报头:Set-Cookie。

测试如下:

我们可以看到在浏览器中就会把内容保存到Cookie中。

那么Cookie是什么呢
是浏览器维护的文件,存在磁盘上或者内存中

但是单单一个Cookie是不安全的,所以我们采用了Cookie+session。

1.5.2 Cookie+session

当我们输入用户名和密码后,服务器会先认证,但是不着急先返回,它先会自动创建一个session文件。然后把用户的临时私密信息,保存在这个文件中。最后,会把session_id(具有唯一性)写入到本地的Cookie中。下次再请求的时候,就会通过session_id来获取信息。

1.6 Connection

用户看到的完整的网页内容,背后可能是无数次的http请求。1.0的HTTP版本,是一种无状态,无连接的应用层协议。 HTTP1.0规定浏览器和服务器保持短暂的链接。并且http底层主流采用的是tcp协议,所以浏览器每次请求都需要与服务器建立一个TCP连接,服务器处理完成以后立即断开TCP连接(无连接),服务器不跟踪也每个客户单,也不记录过去的请求(无状态)。

所以,造成的问题:每次发送请求,都需要进行一次TCP连接,而TCP的连接释放过程又是比较费事的。这种特性会使得网络的利用率变低。

所以在http1.1版本增加Connection字段,通过设置Keep-Alive保持HTTP连接不断卡。避免每次客户端与服务器请求都要重复建立释放建立TCP连接。提高了网络的利用率。

那么我们使用http1.1版本时,在客户端和服务端之间需要进行版本协商工作。如果客户端和服务端的Connection都是Keep-Alive,说明双方同意采用长链接的方案。如果某个当中的Connection是closed,说明只能采用短链接。

相关推荐
HUODUNYUN44 分钟前
小程序免备案
网络·web安全·小程序·1024程序员节
速盾cdn1 小时前
速盾:如何有效防止服务器遭受攻击?
网络·安全·web安全
华纳云IDC服务商1 小时前
怎么选择香港服务器的线路?解决方案
服务器·网络·香港服务器
可可爱爱的你吖1 小时前
webSocket的使用文档
网络·websocket·网络协议
EasyCVR2 小时前
GA/T1400视图库平台EasyCVR视频融合平台HLS视频协议是什么?
服务器·网络·人工智能·音视频
白白♛~2 小时前
网络管理之---3种网络模式配置
linux·服务器·网络
GOTXX2 小时前
NAT、代理服务与内网穿透技术全解析
linux·网络·人工智能·计算机网络·智能路由器
熊明才2 小时前
Ubuntu 22.04.4 LTS + certbot 做自动续签SSL证书(2024-11-14亲测)
数据库·网络协议·ssl
训山2 小时前
4000字浅谈Java网络编程
java·开发语言·网络
写bug的小屁孩4 小时前
websocket身份验证
开发语言·网络·c++·qt·websocket·网络协议·qt6.3