Web基础和Http协议

web基础与http协议

一、web

1、web、http(s)

web：就是网页，打开网站展示的页面。（全球广域网---world wide web，又叫万维网）分布式图形信息系统

http：超文本传输协议

https：（加密的）超文本传输协议

2、分布式

分布式图形信息系统

概念：计算机系统或者是应用程序，分布在多台计算机或者服务器上。通过计算机网络互相通信和协作，共同完成任务或者共同对外提供一致的服务。

设计目标：把工作负载分散到多个节点上。每个节点既是一个整体，也是一个独立的运行体。这种设计提供了高可用的架构，允许分布式节点的服务器出现故障。

3、集群

概念：建立在分布式的基础之上，把多台计算机或者是服务器连接在一起，作为一个整体，形成一个单一的计算资源，也是通过网络连接，共享任务和资源负载，实现高性能和高可用。这些计算机或者服务器，他们的性能基本一致，运行的服务或者应用程序都一致。

目标：通过增加节点和减少节点实现弹性伸缩，提高处理能力和容量。（数据中心、web服务器都是出于集群，大数据处理等等）

4、web的组成结构

网页：纯文本格式的文件，HTML语言（超文本标记语言），是一种规范，也是一种标准。通过标记符号来显示网页中的各个部分。一般来说，我们访问的页面都是.html或者.htm（也是网站的首页）浏览器把html语言进行翻译，形成用户看到的页面》

网站：由一个一个的页面组成，是一个网页的组合体。

域名：访问网站或者浏览页面时输入的地址，也可以叫网址。（www.baidu.com-------与ip地址做映射）

http\https：用来传输网页的通信协议，https就是加密，是一种客户端和服务端之间通信、交互的标准和规范。

URL：万维网的寻址系统，是网站在互联网上的唯一标识。

https://show,bilibili.com/platform/home.html?msource=pc web&spm id from=666.5.0.0

URI：/platform/home

超链接：把网站中的不同网页连接起来

发布：把制作好的网页部署到互联网上，可以分为内和外

内部访问：不提供互联网的对外访问，只能内部局域网访问

外部访问：互联网上公开的页面，所有人都可以访问的页面

5、web的版本

web1.0：网页编辑好之后，用户直接阅读内容，用户无法对页面进行编辑、更改、创建其他内容（网站到用户----单向的）

web2.0：用户也是访问编辑好的页面，但是这个页面用户可以对其进行二次开发（包括分享、弹幕、点赞、送礼等等都是web2.0的新特征），是一个开发的平台。

静态页面：就是标准的HTML文件，文件的扩展名.html或者.htm，就是纯文本、图像、声音、动画等等组成的一个页面。网站建设的基础，早期的网站都是静态页面，没有后台数据库，没有其他程序，也无法交互的页面，更新起来比较麻烦，展示型网站，更新内容比较少的网站。他的URL地址是固定的，内容相对稳定，容易被搜索引擎检索，页面的浏览速度比较快，没有后台程序，不需要连接数据库，页面打开比较快。

动态页面：网页URL不固定，用户可以和后台进行交互（数据库），在动态页面的URL里面有一个符号" ？"。动态页面用的是PHP、JSP、python、ruby

bash 复制代码

动态页面的特点：
1.1 交互性，用户可以对网站发布的页面进行二次创造
1.2 自动更新
1.3 页面的内容会实时的发生变化

静态和动态页面的区别：

1.1 静态页面：看

1.2 静态页面：交互

二、http协议和返回码

1、http和https

http：超文本传输协议

https：（加密的）超文本传输协议

bash 复制代码

http 0.9
http 1.0 基本淘汰
http 1.1 目前的主流
https 2.0 加密的协议   新一代的加密协议，是http1.1的升级版。

2、http1.0和http1.1之间的区别？

bash 复制代码

#缓存机制#
缓存可以把用户的一个行为和操作，保存下来，下次访问可以保留这些状态，不需要在和web服务器进行额外的通信，提高了访问效率。缓存有的是保存在本地，有的是保存在web服务器，现在得缓存基本是保存在用户的本机（缓存由浏览器保存），缓存的保留时间，一般来说是30天到180天，一般网站都是30天左右
http1.0只有一种缓存策略
http1.1引入更多的缓存策略

bash 复制代码

#长连接#
http1.1支持长连接，在一个tcp连接上可以传输多个http请求和响应。一次性获取页面所有内容

bash 复制代码

#带宽优化和网络连接的使用#
http1.0一次只能获取一个对象，其他对象还要继续的建立连接获取数据
http1.1 只有建立了连接，除非数据发送完毕，否则不需要为了其他的资源专门再建立额外的连接

3、http的工作方式

请求----------客户端发起

响应----------服务端发起

3.1 请求

请求的方式：GET POST

请求的内容：请求头、请求体

method：GET 请求的方式

Accept：客户端获取的页面

Accept-Enocoding ：客户端可以接受的编码方式

Accept-Language：客户端可以接受的语言类型

Cache-Control：客户端需要页面缓存的时间

Connection：keep-alive 客户端通知服务端，服务端在数据传输完毕之后不要马上关闭连接，让连接保持一段时间（60s、120s、180s）

Host：客户端请求的ip和端口

User-Agent：客户端的请求工具，用什么浏览器发起的请求以及发起的系统是什么

3.2 响应

响应----------服务端发起

响应的内容：响应头、响应体

Connection：响应客户端的连接方式

Content-Encoding：响应客户端的编码

Content-Type ：响应编码的类型，发送数据的类型

Date ：响应的时间

Server：使用web服务的软件和版本

Strict-Transport-Security：响应客户端的缓存时间

Request Method：客户端请求方式是get（GET）

Status Code：请求收到之后，服务端对请求的响应的状态码

3.3 响应码

1xx：100-101 信息提示一般不考虑

2xx：200-206 成功

3xx ：300-305 重定向和缓存

4xx ：400-415 客户端错误（客户端请求的内容或是页面不存在）

5xx：500--505 服务端错误web服务软件本身处了故障，无法响应

3.4 http常见的状态码

200：ok 请求成功

301：永久重定向，请求的页面永久的到其他页面

302 ：临时重定向，网站维护时使用

304 ：访问的是本地缓存

403 ：用户的请求禁止访问

404 ：用户请求的网页不存在

500 ：内部服务错误，一般是软件层面也有可能是硬件，也可能是防火墙

4、如果出现了500，怎么来排查这个错误？

501：Bad Gateway 无效网关（防火墙，限制了转发功能）

503：service unavailable 服务不可用

504：Gateway timeout 网关请求超时

5、post方式

区别于get，get就是向服务器发送请求，请求不带任何参数，由http协议自行约定的

post也是发送数据，也是依照http协议，post会更改服务器数据。post之后会在服务器上多一条数据，或者对原数据进行修改

get的请求可以被缓存，post没有缓存

get的请求记录会保存在浏览记录（cooike），post不会被保存

get就是获取数据，post会修改数据

get的请求长度是有限制的，而且请求的字符串会显示在url当中

post请求没有长度限制，而且字符串也不再url当中显示

动态页面.jsp .js .php为结尾的文件