GO语言学习(五)
前面我们已经学了一些关于golang的基础知识,从这一期开始,我们就来讲解一下基于golang为后端的web开发,首先这一期为一些golang为后端的web开发基础讲解,我们将会从web的工作方式、golang如何构建简单web服务、golang如何使得web正常工作、golang的http包详解。请大家持续关注本博客,相信各位读者定然会在读完本系列博客会有自己的收获,大家加油。
web的工作方式
web工作基本流程
- 客户机通过连接DNS服务器获得IP进而获得IP,然后与服务器建立TCP连接(遵循IP/TCP协议)
- 客户机发送请求(以HTTP协议请求包的形式发送),请求服务器开始解析此请求,并调用服务器的资源
- 服务器返回客户机返回资源(HTTP协议的应答包),客户机解析这些资源,并将整理后的数据返回客户端,客户端通过引擎解析这些资源,并将这些资源(HTML)渲染到客户端
- 断开客户机(客户端)与服务器的TCP连接(非持续连接),保证资源的合理利用,下次再想获得资源,就再从新构建一次这样的连接
URL和DNS原理解析
**URL(Uniform Resource Locator)**是"统一资源定位符"的英文缩写,用于描述一个网络上的资源位置,这里给出一个基本结构:
基本格式:scheme://host[:port#]/path/.../[?query-string][#anchor]
// 注意上面的关于数据资源和锚点的前面的特殊符号必须要带上(?#),,中括号[]的内容是可增内容,非必要选项
scheme 指定底层使用的协议(例如:http, https, ftp)
host HTTP服务器的IP地址或者域名
port# HTTP服务器的默认端口是80,这种情况下端口号可以省略。如果使用了别的端口,那么必须指明。
例如: http://www.cnblogs.com:8080/
path 访问资源的路径
query-string 发送给http服务器的数据
anchor 锚
DNS(Domain Name System)是"域名系统"的英文缩写,DNS其实是一位"翻译官",是一种组织成域层次结构的计算机和网络服务命名系统,它用于TCP/IP网络,主要就是翻译主机名或域名转换为实际IP地址的工作。
这样讲解你是不是更加清晰,好的,我们现在就来充分理解一下DNS服务器的相关工作流程:
- 首先当你向地址栏中输入一个URL时,操作系统会先检查自己本地的hosts文件是否有这个网址映射关系,如果有,就先调用这个IP地址映射,完成域名解析。
- 如果hosts里没有这个域名的映射,则查找本地DNS解析器缓存,是否有这个网址映射关系,如果有,直接返回,完成域名解析。
- 如果hosts与本地DNS解析器缓存都没有相应的网址映射关系,首先会找TCP/IP参数中设置的首选DNS服务器,在此我们叫它本地DNS服务器,此服务器收到查询时,如果要查询的域名,包含在本地配置区域资源中,则返回解析结果给客户机,完成域名解析,此解析具有权威性。
- 如果要查询的域名,不由本地DNS服务器区域解析,但该服务器已缓存了此网址映射关系,则调用这个IP地址映射,完成域名解析,此解析不具有权威性。
- 如果本地DNS服务器本地区域文件与缓存解析都失效,则根据本地DNS服务器的设置(是否设置转发器)进行查询,如果未用转发模式,本地DNS就把请求发至 "根DNS服务器","根DNS服务器"收到请求后会判断这个域名(.com)是谁来授权管理,并会返回一个负责该顶级域名服务器的一个IP。本地DNS服务器收到IP信息后,将会联系负责.com域的这台服务器。这台负责.com域的服务器收到请求后,如果自己无法解析,它就会找一个管理.com域的下一级DNS服务器地址(xx.com)给本地DNS服务器。当本地DNS服务器收到这个地址后,就会找xx.com域服务器,重复上面的动作,进行查询,直至找到www.xx.com主机。
- 如果用的是转发模式,此DNS服务器就会把请求转发至上一级DNS服务器,由上一级服务器进行解析,上一级服务器如果不能解析,或找根DNS或把转请求转至上上级,以此循环。不管本地DNS服务器用的是转发,还是根提示,最后都是把结果返回给本地DNS服务器,由此DNS服务器再返回给客户机。
从这里面我们可以得出相应的服务器最后交互是通过DNS服务器解析后的IP进行交互的,这样子也就组建起了IP/TCP服务协议,下面就来细节讲解一下HTTP网络协议,帮助大家更好的理解web工作深层奥义。
HTTP协议详解
这里面详解一下HTTP这和概念,其实HTTP是一种让Web服务器与浏览器(客户端)通过Internet发送与接收数据的协议,它建立在TCP协议之上,一般采用TCP的80端口。它是一个请求、响应协议--客户端发出一个请求,服务器响应这个请求。在HTTP中,客户端总是通过建立一个连接与发送一个HTTP请求来发起一个事务。服务器不能主动去与客户端联系,也不能给客户端发出一个回调连接。客户端与服务器端都可以提前中断一个连接。例如,当浏览器下载一个文件时,你可以通过点击"停止"键来中断文件的下载,关闭与服务器的HTTP连接。
HTTP协议是无状态 的,同一个客户端的这次请求和上次请求是没有对应关系的,对HTTP服务器来说,它并不知道这两个请求是否来自同一个客户端。为了解决这个问题, Web程序引入了Cookie机制来维护连接的可持续状态。
这一点需要补充一下关于一些网络安全的相关知识:HTTP协议是建立在TCP协议之上的,因此TCP攻击一样会影响HTTP的通讯,例如比较常见的一些攻击:SYN Flood是当前最流行的DoS(拒绝服务攻击)与DdoS(分布式拒绝服务攻击)的方式之一,这是一种利用TCP协议缺陷,发送大量伪造的TCP连接请求,从而使得被攻击方资源耗尽(CPU满负荷或内存不足)的攻击方式,大家有兴趣的可以去网络学习一下相关知识,篇幅有限在这里我就不多阐述。
下面我们来讲解一下HTTP请求包的一些细节知识,一步一步带你吃透这个知识点:
请求包分为三个内容
- 请求头
- 请求行
- 请求主体
下面给出具体的示例帮助大家更好的理解请求包,大家有条件的可以找相应的例子自己来实际操作一遍,这样大家才会理解得更深,加油各位友友们,也欢迎各位友友们在评论区中与我一同探讨这个HTTP协议的更深层次原理。
GET /domains/example/ HTTP/1.1 // 请求行: 请求方法 请求URI HTTP协议/协议版本
Host:www.iana.org // 服务端的主机名
User-Agent:Mozilla/5.0 (Windows NT 6.1) AppleWebKit/537.4 (KHTML, like Gecko)
// 代理位置可以参考一些具体设置,通过按住F12可以查看相应的请求信息
dChrome/22.0.1229.94 Safari/537.4 // 浏览器信息,这里面给出的是一个谷歌浏览器的相关链接
Accept:text/html,application/xhtml+xml,application/xml;q=0.9,*/*;q=0.8 // 客户端能接收的MIME
Accept-Encoding:gzip,deflate,sdch // 是否支持流压缩
Accept-Charset:UTF-8,*;q=0.5 // 客户端字符编码集
//空行,用于分割请求头和消息体。
//消息体,请求资源参数。
HTTP构建的请求方法获取信息有下面几种,我给大家简单罗列一下:
GET
POST
PUT
DELETE
这里面的一些操作分别对应着资源信息的查、增、改、删,其中GET一般用于获取/查询相关返回的资源文件信息,POST则用于更新资源信息。
这里面的有很多细节我就在这里不多赘述,大家可以自行查看了解,视频链接
这里面可以通过许多抓包工具来实现获取相应的请求包,这里面附上学习视频链接,方便大家学习,视频学习
这里面补充一点就是关于GET和POST的区别:
- GET方式提交数据,会带来安全问题,比如一个登录页面,通过GET方式提交数据时,用户名和密码将出现在URL上,如果页面可以被缓存或者其他人可以访问这台机器,就可以从历史记录获得该用户的账号和密码。
- 我们可以看到GET请求消息体为空,POST请求带有消息体。
- GET提交的数据会放在URL之后,以
?
分割URL和传输数据,参数之间以&
相连,而POST方法则是把提交的数据放在HTTP包的body中。- GET提交的数据大小有限制(因为浏览器对URL的长度有限制),而POST方法提交的数据没有限制。
前面我们已经初步学习了请求包下面我们来讲解一下HTTP相应包的一些细节知识,一步一步带你吃透这个知识点:
HTTP/1.1 200 OK //状态行,,由HTTP协议版本号, 状态码, 状态消息 三部分组成。
Server: nginx/1.0.8 //服务器使用的WEB软件名及版本
Date:Date: Tue, 30 Oct 2012 04:14:25 GMT //发送时间
Content-Type: text/html //服务器发送信息的类型
Transfer-Encoding: chunked //表示发送HTTP包是分段发的
Connection: keep-alive //保持连接状态
Content-Length: 90 //主体内容长度
//空行 用来分割消息头和主体
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN"... //消息体
**补充:**状态码用来告诉HTTP客户端,HTTP服务器是否产生了预期的Response。HTTP/1.1协议中定义了5类状态码, 状态码由三位数字组成,第一个数字定义了响应的类别,下面我们就来细节的说明一下这些字关于的相应细节(大家可以自行记忆):
- 1XX 提示信息 - 表示请求已被成功接收,继续处理
- 2XX 成功 - 表示请求已被成功接收,理解,接受
- 3XX 重定向 - 要完成请求必须进行更进一步的处理
- 4XX 客户端错误 - 请求有语法错误或请求无法实现
- 5XX 服务器端错误 - 服务器未能实现合法的请求
HTTP协议是无状态的和Connection: keep-alive的区别
无状态是指协议对于事务处理没有记忆能力,服务器不知道客户端是什么状态。从另一方面讲,打开一个服务器上的网页和你之前打开这个服务器上的网页之间没有任何联系。
HTTP是一个无状态的面向连接的协议,无状态不代表HTTP不能保持TCP连接,更不能代表HTTP使用的是UDP协议(面对无连接)。
Keep-Alive不会永久保持连接,它有一个保持时间,可以在不同服务器软件(如Apache)中设置这个时间。
还有一点就是:从HTTP/1.1起,默认都开启了Keep-Alive保持连接特性,简单地说,当一个网页打开完成后,客户端和服务器之间用于传输HTTP数据的TCP连接不会关闭,如果客户端再次访问这个服务器上的网页,会继续使用这一条已经建立的TCP连接。
总结
其实上述的这些就是浏览器的一个功能,第一次请求url,服务器端返回的是html页面,然后浏览器开始渲染HTML:当解析到HTML DOM里面的图片连接,css脚本和js脚本的链接,浏览器就会自动发起一个请求静态资源的HTTP请求,获取相对应的静态资源,然后浏览器就会渲染出来,最终将所有资源整合、渲染,完整展现在我们面前的屏幕上。
其中网页优化方面有一项措施是减少HTTP请求次数,就是把尽量多的css和js资源合并在一起,目的是尽量减少网页请求静态资源的次数,提高网页加载速度,同时减缓服务器的压力。
这一节就先讲到这里,在此先恭喜大家已经学习到了第二个主题,大家都是最棒的,这里我在此谢谢大家的持续关注
下一节为利用GO构建自己的第一个WEB服务器,大家请关注~~~~