目录
[一、Web 基础](#一、Web 基础)
[1、域名和 DNS](#1、域名和 DNS)
[(2)Hosts 文件](#(2)Hosts 文件)
[②修改Hosts 文件](#②修改Hosts 文件)
[2、网页与 HTML](#2、网页与 HTML)
[(2)HTML 概述](#(2)HTML 概述)
[①HTML 基本标签](#①HTML 基本标签)
[二、HTTP 协议](#二、HTTP 协议)
[1、HTTP 协议概述](#1、HTTP 协议概述)
[2、HTTP 方法](#2、HTTP 方法)
[3、HTTP 状态码](#3、HTTP 状态码)
一、Web 基础
1、域名和 DNS
(1)域名的概念
网络是基于TCP/IP协议进行通信和连接的,每一台主机都有一个唯一的标识(固定的IP地址),用以区别在网络上成千上万个用户和计算机。
网络在区分所有与之相连的网络和主机时,均采用一种唯一、通用的地址格式,即每一个与网络相连接的计算机和服务器都被指派一个独一无二的地址。为了保证网络上每台计算机的IP地址的唯一性,用户必须向特定机构申请注册,分配 IP地址。网络中的地址方案分为两套:IP地址系统和域名地址系统。这两套地址系统其实是一一对应的关系。
IP地址用二进制数来表示,每个IP地址长 32比特,由4个小于256的数字组成,数字之间用点间隔,例如100.10.0.1 表示一个IP地址。
由于IP地址是数字标识,使用时难以记忆和书写,因此在IP地址的基础上又发展出一种符号化的地址方案,来代替数字型的IP 地址。每一个符号化的地址都与特定的IP地址对应,这样网络上的资源访问起来就容易得多了。这个与网络上的数字型IP地址相对应的字符型地址,就被称为域名。通俗的说,域名就相当于一个家庭的门牌号码,别人通过这个号码可以很容易地找到你。
①域名的结构
以一个常见的域名为例说明其结构。
www. baidu.com网址是由二部分组成,标号"baidu"是这个域名的主体,而最后的标号"com"则是该 域名的后缀,代表的这是一个com国际域名,是顶级域名,而前面的www是主机名。
②域名结构类型
根域:指的是根服务器,要用来管理互联网的主目录,全世界只有13台。由ICANN统一管理,负责全球互联网域名根服务器、域名体系和IP地址等的管理。
顶级域:包括组织域和国家/地区域名。域名的最右侧是国家/地区域名,国家代码由两个字母组成的如.cn,.uk,.de和.jp,其中.cn是中国专用的顶级域名。在国家/地区域名左侧,是组织域名,常见的.com用于商业机构,.net 用于网络组织,.org用于各种组织包括非盈利组织。
二级域名:在顶级域名之前的域名,在顶级域名前面,它是指域名注册人的网上名称,例如baidu,ibm,yahoo,microsoft等。
FQDN:是主机名 .DNS 后缀,是指主机名加上全路径,全路径中列出了序列中所有域成员。全域名可以从逻辑上准确地表示出主机在什么地方,也可以说全域名是主机名的一种完全表示形式。
(2)Hosts 文件
Hosts文件是一个用于存储计算机网络中节点信息的文,它可以将主机名映射到相应的IP地址,实现DNS的功能,它可以由计算机的用户进行修改控制。
①Hosts文件的作用
在网络上访问网站,要首先通过DNS服务器把要访问的域名解析成IP地址后,计算机才能对这个网络域名作网站进行访问。
对于每个域名请求,如果都要等待域名服务器解析后返回IP信息,那么访问网络的效率就会降低,因为DNS做域名解析和返回IP都需要时间。为了提高对经常访问的网络域名的解析效率,可以通过利用在Hosts文件中建立域名和 IP 的映射关系来达到目的。
根据系统规定,在进行DNS请求以前,系统会先检查自己的Hosts文件中是否有这个网络域名映射关系。如果有则调用这个 IP地址映射,如果没有,再向已知的DNS服务器提出域名解析,即Hosts的请求级别比DNS高。
②修改Hosts 文件
Windows系统中Hosts文件存储在目录c:\windows\system32\drivers\etc\ 下面,用记事本可以对其进行修改,OpenEuler系统中Hosts文件存储在目录 /etc/目录下面,用vim /etc/hosts可以对其进行修改。
(3)DNS
在互联网上域名与IP地址之间是一一对应的,域名虽然便于人们记忆,但机器之间只能互相认识IP地址,它们之间的转换工作称为域名解析,域名解析要由专门的域名解析系统来完成,DNS就是进行域名解析的系统。
主机名到IP地址的映射有两种方式:
静态映射:每台设备上都配置主机到IP地址的映射,各设备独立维护自己的 映射表,而且只供本设备使用。
动态映射:建立一套域名解析系统(DNS),只在专门的DNS服务器上配置主机到IP地址的映射,网络上需要使用主机名通信的设备,首先需要到DNS服务器查询主机所对应的IP地址。
通过主机名,最终得到该主机名对应的IP地址的过程叫做域名解析(或主机名解析)。在解析域名时,可以首先采用静态域名解析的方法。如果静态域名解析不成功,再采用动态域名解析的方法。可以将一些常用的域名放入静态域名解析表中,这样可以大大提高域名解析效率。
2、网页与 HTML
网页是构成网站的基本元素,是承载各种网站应用的平台。通俗地说,网站就是由网页组成的。如果只有域名和虚拟主机而没有制作任何网页,那么客户仍旧无法访问这个网站。因为网页是由**HTML(超文本标记语言)**编写的。
(1)网页概述
网页是一个文件,它存放在世界某个角落的某一部计算机中,而这部计算机必须是与互联网相连的。网页经由网址(URL)来识别与存取,是互联网中的一"页"。
网页可以包括如下内容:
|-------------|---------------------------------------------------------|
| 内容 | 作用 |
| 文本 | 文本是网页上最重要的信息载体与交流工具,网页中的主要信息一 般都以文本形式为主。 |
| 图像 | 图像元素在网页中具有提供信息并展示直观形象的作用。 |
| Flash动画 | 动画在网页中的作用是有效地吸引访问者更多的注意。 |
| 声音 | 声音是多媒体和视频网页重要的组成部分。 |
| 视频 | 视频文件的采用使网页效果更加精彩且富有动感 |
| 表格 | 表格是在网页中用来控制页面信息的布局方式。 |
| 导航栏 | 导航栏在网页中是一组超链接,其连接的目的端是网页中重要的页面。 |
| 交互式表单 | 表单在网页中通常用来联接数据库并接受访问用户在浏览器端输入的数据,利用数据库为客户端与服务器端提供更多的互动。 |
网页相关概念::
|----------|--------------------------------------------------------------------------------|
| 概念 | 描述 |
| 域名 | 是浏览网页时输入的网址。 |
| HTTP | 用来传输网页的通信协议,使用浏览器访问网址时,在域名前面要 加上http://,表示使用http协议传输网页。 |
| URL | 是一种万维网寻址系统,表示网络上资源的位置路径。 |
| HTML | 是编写网页的超文本标记语言。 |
| 超链接 | 具备将网站中不同网页链接起来的功能。 |
| 发布 | 将制作好的网页上传到服务器供用户访问的过程。 |
(2)HTML 概述
HTML叫做超文本标记语言,是一种规范,也是一种标准,它通过标记符号来标记要显示的网页中的各个部分。
网页文件本身是一种文本文件,通过在文本文件中添加标记符,可以告诉浏览器如何显示其中的内容。如:文字如何处理,画面如何安排,图片如何显示等。
浏览器按顺序阅读网页文件,然后根据标记符解释和显示其标记的内容,对书写出错的标记将不指出其错误,且不停止其解释执行过程,开发者只能通过显示效果来分析出错原因和出错部位。但需要注意的是,不同的浏览器,对同一标记符可能会有不完全相同的解释,因而可能会有不同的显示效果。
HTML文件可以使用任何能够生成txt文件的文本编辑器来编辑,生成超文本标记语言文件,只用修改文件名后缀为".html"或".htm"即可。
①HTML 基本标签
1.HTML语法规则
HTML 标签采用双标记符的形式,前后标记符对应,分别表示标记开始和结束,标记符中间的内容被标签描述。前标记符由"<XXX>"表示,结尾标记符多了 一个"/",由"</XXX>"表示。
2.HTML文件结构
HTML文件最外层由<html></htm>表示,说明该文件是用HTML语言描述的。在 它里面是并列的头标签(head>)和内容标签(body>)。
最基本的HTML文件结构如下:
<htm1>
<head>网页的内容描述信息<head>
<body>网页显示的内容</body>
</htm1>
常用的头标签中的标签如下:
|----------------|-------------------|
| 标签 | 描述 |
| <title> | 定义了文档的标题 |
| <base> | 定义了页面链接标签的默认链接地址 |
| <link> | 定义了一个文档和外部资源之间的关系 |
| <meta> | 定义了HTML 文档中的元数据 |
| <script> | 定义了客户端的脚本文件 |
| <style> | 定义了HTML 文档的样式文件 |
内容标签中常用的标签如下:
|---------------|--------------|
| 标签 | 描述 |
| <table> | 定义一个表格 |
| <tr> | 定义了表格中的一行 |
| <td> | 定义了表格中某一行的一列 |
| <a> | 定义了一个超链接 |
| <br> | 定义了换行 |
| <font> | 定义了字体 |
(3)网站和主页
网站是由网页组成的,包含多个网页页面,具有独立域名、独立存放空间的内容集合,这些内容可能是网页,也可能是程序或其他文件。
主页(首页)是用户打开浏览器时默认打开的网页。
当一个网站服务器收到一台电脑上网络浏览器的消息连接请求时,便会向台计算机发送这个文档。当在浏览器的地址栏输入域名,而未指向特定目录或文件时,通常浏览器会打开网站的首页。网站首页往往会被编辑得易于了解该网站提供的信息,并引导互联网用户浏览网站其他部分的内容。这部分内容一般被认为是一个目录性质的内容。
3、静态网页与动态网页
(1)静态网页
在网站设计中,纯粹HTML格式的网页通常被称为"静态网页",静态网页是标准的HTML文件,它的文件扩展名是.htm、.html。静态网页是网站建设的基础,早期的网站一般都是由静态网页制作的。静态网页也可以出现各种动 态的效果,如.GIF格式的动画、FLASH、滚动字幕等。这些"动态效果"只是视觉上的,与下面将要介绍 的动态网页是不同的概念。
(2)动态网页
所谓的动态网页,是指跟静态网页相对的一种网页编程技术。静态网页,随 着HTML.代码的生成,页面的内容和显示效果就基本上不会发生变化了------除非是修改页面代码。而动态网页则不然,页面代码虽然没有变,但是显示的内容却是可以随着时间、环境或者数据库操作的结果而发生改变的。
动态网 页URL的后缀不是.htm、.html、.shtml、.xml等静态网页 的常见网页制作格式,而是以.aspx、.asp、.jsp、.php、.perl、 cgi等形式为后缀,并且在动态网页网址中有一个标志性的符号--"?"。
动态网页是基本的html语法规范与Java、PHP、C#等高级程序设计语言、数据库编程等多种技术的融合,以期实现对网站内容和风格的高效、动态和交互式的管理。因此,从这个意义上来讲,凡是结合了HTML以外的高级程序设计语言和数据库技术进行的网页编程技术生成的网页都是动态网页。
目前常用的动态网页编程语言如PHP(Hypertext Preprocessor,超文本预处理器)、JSP(Java Server Pages,Java服务器页面)、Python、Ruby。
二、HTTP 协议
**超文本传输协议(HTTP,HyperText Transfer Protocol)**是互联网上应用 最广泛的一种网络协议。所有的网页文件都必须遵守这个标准。设计HTTP最初 的目的是为了提供一种发布和接收HTMIL页面的方法。
1、HTTP 协议概述
HTP协议采用了请求/响应模型。客户端向服务器发送一个请求,请求头包含请求的方法、URL、协议版本、以及包含请求修饰符、客户信息和内容的类似于MIME的消息结构。服务器以一个状态行作为响应,响应的内容包括消息协议的版本,成功或者错误编码加上服务器信息、实体元信息以及可能的实体内容。
2、HTTP 方法
HTTP支持几种不同的请求命令,这些命令被称为HTTP 方法(HTP meth d)。每条HTTP请求报文都包含一个方法,告诉服务器要执行什么动作,包括:获取一个页面,运行一个网关程序,删除一个文件等。最常用的获取资源的方法是GET、POST。
HTTP 常用方法如下:
|------------|--------------------------------|
| HTTP方法 | 描述 |
| GET | 请求获取Request-URI 所标识的资源 |
| PUT | 请求服务器存储一个资源,并用Request-URI作为其标识 |
| DELETE | 请求服务器删除Request-URI所标识的资源 |
| POST | 在Request-URI所标识的资源后附加新的数据 |
| HEAD | 请求获取由Request-URI所标识的资源的响应消息报头 |
GET方法采用的是URL后缀的形式,比如http://www.test.com/a.php?I \(d=123\) 就是一个GET请求,服务器接收后可以解析出 \(Id=123\) 。而POST方法不需要在URL中显示"?Id=123",参数作为内容进行了隐藏的提交。因此, 表单类或者有用户名、密码等内容提交时建议使用POST方法。
GET 和 POST比较如下:
|----------|----------------------------------------------------------------|----------------------------------------------|
| | GET方法 | POST方法 |
| 对数据长度的限制 | URL的长度是受限制的 (2048 个字符) | 无限制 |
| 缓存 | 能被缓存 | 不能缓存 |
| 安全性 | 与POST 相比, GET 的安全性较差, 因为所发送的数据是 URL 的一部分。在发送密码或其他敏感信息时绝不要使用 ET | POST 比 GET 更安全, 因为 参数不会被保存在浏览器历 史或Web 服务器日志中 |
| 历史 | 参数保留在浏览器历史中 | 参数不会保存在浏览器历史中 |
| 后退按钮/刷新 | 无害 | 数据会被重新提交, 浏览器应该告知用户数据会被重新提交 |
| 书签 | 可收藏为书签 | 不可收藏为书签 |
3、HTTP 状态码
HTTP状态码(HTTP Status Code)是用以表示网页服务器HTTP响应状态的3位数字代码,当浏览器请求某一URL时,服务器根据处理情况返回相应的处理状态。
HTTP 状态码大致可以分为以下五类:
|-------|-------------|-----------|
| 状态码首位 | 已定义范围 | 分类 |
| 1xx | 100-101 | 信息提升 |
| 2xx | 200-206 | 成功 |
| 3xx | 300-305 | 重定向 |
| 4xx | 400-415 | 客户端错误 |
| 5xx | 500-505 | 服务器错误 |
生产环境常见的状态码如下:
|---------------------------|---------------------------|
| 消息 | 描述 |
| 200 OK | 请求成功(其后是对GET和POST请求的应答文档) |
| 301 Moved Permanently 302 | 请求的永久页面跳转 临时也页面跳转 |
| 301 Moved Permanently 302 | 请求的永久页面跳转 临时也页面跳转 |
| 403 Forbidden | 禁止访问该页面 |
| 404 Not Found | 服务器无法找到被请求的页面 |
| 500 Internal Server Error | 内部服务器错误 |
| 502 Bad Gateway | 无效网关 |
| 503 Service Unavailable | 当前服务不可用 |
| 504 Gateway Timeout | 网关请求超时 |