Socket是对TCP/IP协议的封装,Socket本身并不是协议,而是一个调用接口(API),通过Socket,我们才能使用TCP/IP协议,主要利用三元组【ip地址,协议,端口】。
Http协议即超文本传输协议,是Web联网的基础,也是手机联网常用的协议之一,http协议是建立在TCP协议之上的一种应用。
socket连接:socket连接即是所谓的长连接,理论上客户端和服务端一旦建立连接,则不会主动断掉;
Http连接:http连接就是所谓的短连接,及客户端向服务器发送一次请求,服务器端相应后连接即会断掉。
1. 套接字(socket)概念
套接字(socket)是通信的基石,它起源于Unix,而Unix/Linux基本哲学之一就是"一切皆文件",都可以用"打开open --> 读写write/read --> 关闭close"模式来操作。它是支持TCP/IP协议的网络通信的基本操作单元,他是网络通信过程中端点的抽象表示,他包含网络通信必须的五种信息:连接使用的协议,本地主机的IP地址,本地进程的协议端口,远程主机的IP地址,远地进程的协议端口。
应用层通过传输层进行数据通信时,TCP会遇到同时为多个应用程序提供并发服务的问题,多个TCP连接多个应用程序进程可能需要通过同一个TCP协议端口传输数据,为了区别不同的应用程序进程和连接,许多计算机操作系统为应用程序与TCP/IP协议交互提供了套接字(socket)接口,应用层可以和传输层通过socket接口区分来自于不同应用进程或网络连接的通信,实现数据传输的并发服务。
2. Socket通信的数据传输方式
常用的有两种:
a、SOCK_STREAM:表示面向连接的数据传输方式。数据可以准确无误地到达另一台计算机,如果损坏或丢失,可以重新发送,但效率相对较慢。常见的 http 协议就使用 SOCK_STREAM 传输数据,因为要确保数据的正确性,否则网页不能正常解析。
b、SOCK_DGRAM:表示无连接的数据传输方式。计算机只管传输数据,不作数据校验,如果数据在传输中损坏,或者没有到达另一台计算机,是没有办法补救的。也就是说,数据错了就错了,无法重传。因为 SOCK_DGRAM 所做的校验工作少,所以效率比 SOCK_STREAM 高。
例如:QQ 视频聊天和语音聊天就使用 SOCK_DGRAM 传输数据,因为首先要保证通信的效率,尽量减小延迟,而数据的正确性是次要的,即使丢失很小的一部分数据,视频和音频也可以正常解析,最多出现噪点或杂音,不会对通信质量有实质的影响
3. 建立socket连接
建立socket连接至少需要一对套接字,其中一个运行于客户端,称为ClientSocket,另一个运行与服务器,称为ServerSocket。
套接字之间的连接分为三个步骤:服务器监听、客户端请求、连接确认。
服务器监听:服务端套接字并不定位具体的客户端套接字,而是处于等待连接的状态,实时监控网络状态,等待客户端的连接请求。
客户端请求:至客户端的套接字提出连接请求,要练级的目标是服务器端的套接字,为此客户端的套接字必须首先描述他要连接的服务器的套接字,指出服务器端套接字的地址和端口号,然后向服务器端套接字提出连接请求。
连接确认:当服务器端套接字监听到或者说接收到客户端的套接字连接请求是,就响应客户端套接字的请求,建立一个新的线程,把服务器端套接字的描述发给客户端,一旦客户端确认了此描述,双方就正式链接链接,而服务器端 套接字继续处于监听状态,继续接受其他客户端套接字的连接请求。
4. Socket连接与TCP连接
创建Socket连接时,可以指定使用的传输层协议,socket可以支持不同的传输层协议(TCP/UDP),当使用TCP协议进行连接时,该socket接连就是TCP链接.
通常情况下Socket连接就是TCP连接,因此Socket连接一旦建立,通信双方即可开始相互发送数据内容,至到双方连接断开。但在实际网络应用中,客户端连接服务器之间的通信往往需要穿越多个中间节点,例如路由器,网关,防火墙等,大部分防火墙默认会关闭那个长时间处于活跃状态的连接而导致的Socket连接断连,因此需要轮询告诉网络,该链接处于活跃状态。
erHTTp连接使用的是"请求一响应"的方式,不仅在请求时需要先建立连接,而且需要客户端向服务器发出请求后,服务端才能回复数据。
很多情况下,需要服务器端主动向客户端推送数据,保持客户端和服务器数据实时与同步,此时若双方建立的是Socket连接,服务器就可以直接将数据传送给客户端;若双方建立的是HTTP连接,则需要等到客户端发送一次请求后向服务端发送连接请求,不仅可以保持在线,同时也是在"询问"服务器是否有新的数据,如果有就传给客户端。
5. 两种网络模型
a.TCP/IP对OSI的网络模型层进行了划分如下:
b.TCP/IP协议参考模型把所有的TCP/IP系列协议归类到四个抽象层中
应用层:TFTP,HTTP,SNMP,FTP,SMTP,DNS,Telnet 等等
传输层:TCP,UDP
网络层:IP,ICMP,OSPF,EIGRP,IGMP
数据链路层:SLIP,CSLIP,PPP,MTU
6.Socket常用函数接口及其原理
HTTP
1.http和https的区别
-
安全性:Https是安全超文本协议,在http基础上有更强的安全性,简单来说,https使用TLS/SSL加密的http协议,即Https在http的基础上加入了SSL层(SSL的英文全称是Secure Sockets)
-
传输协议 :HTTP协议的信息是明文传输,HTTP协议的信息是明文传输
-
证书:HTTPS协议需要到CA申请证书,一般免费证书较少,因而需要一定费用。这是HTTPS相比HTTP的又一个重要区别。
-
端口和连接方式:HTTP的默认端口是80,而HTTPS的默认端口是443。此外,HTTP和HTTPS使用的是完全不同的连接方式,二者所用的端口也不一样。
2.TCP三次握手
1.第一次握手:建立连接时,客户端发送SYN包到服务器,并且,客户端进入SYN_SEND状态,等待服务器确认
2.第二次握手:服务器收到SYN包后,同时,发送一个SYN+ACK包给客户端,此时,服务器进入SYN_RECV状态
3.第三次握手:客户端收到服务器的SYN和ACK包后,向服务器发送确认的ACK包,此包发送完毕,客户端和服务器进入established状态,完成第三次握手
3.四次挥手
四次挥手(four-way handshake)是指在TCP连接关闭时,双方发送确认消息的过程。这个过程由四个步骤组成:
连接关闭请求:首先,发送方发送一个带有FIN(结束)标志的数据包,表示它已经完成数据传输并希望关闭连接。
2.
确认收到请求:接收方收到这个数据包后,会向发送方发送一个带有ACK(确认)标志的数据包,表示已经收到连接关闭请求。
3.
确认关闭:然后,接收方也发送一个带有FIN标志的数据包,向发送方表示它也已经完成数据传输并希望关闭连接。
4.
确认收到关闭:最后,发送方收到这个数据包后,会向接收方发送一个带有ACK标志的数据包,表示已经收到连接关闭的确认消息
UDP概念
用户数据协议 UDP(User Datagram Protocol),提供无连接的数据传输服务。
应用场景
即时通信,比如: 语音、视频 、直播等
TCP概念
传输控制协议 TCP(Transmission Control Protocol),提供面向连接的,可靠的数据传输服务。
应用场景
文件传输、发送和接收邮件、远程登录等
为什么要进行"四次"挥手?
因为要确保服务端和客户端都停止发送数据。
为什么最后一次需等待2MSL(TIME_WAIT)?
MSL:最大分段寿命,表示一个 TCP 分段可以存在于互联网系统中的最大时间。
1、保证客户端发的报文到达服务端且若失败可重发。
2、确保所有旧数据消失,新的连接中不会存在旧的请求。
为什么会出现大量 CLOSE_WAIT 的现象?
在对方已经发送 FIN 后,由于服务器自己及时没有发送 ACK 确认,程序无法检测关闭,此时一直保持连接状态无法关闭,因此出现 close_wait 。
解决:检测出对方已经关闭的 socket 并关闭。
1、代码需要判断 socket,一旦读到 0,就断开连接,read返回负,检查一下error,如果不是AGAIN,就断开连接。
2、给每个 socket 添加一个时间戳,定期检查所有时间戳,如果时间戳与当前时间的差值超过一定阈值,即关闭此连接。
TCP 和 UDP 的区别
协议 是否可靠 是否面向连接 传输效率 传输形式 通信 首部字节
TCP 是 是 慢 字节流 一对一 20字节
UDP 否 否 快 报文 各种形式 8字节
为什么 TCP 是面向连接的?
因为 TCP 在数据传输之前会先建立连接,即三次握手。
为什么 TCP 是可靠的?
1、校验和: TCP 的检验和是为了检测数据在传输过程中的任何变化。如果检验和有差错,TCP 将丢弃这个报文段。
2、TCP 的接收端会丢弃重复数据。
3、流量控制: TCP 的接收端只允许发送端发送缓冲区能接纳的数据,防止丢包。(TCP 利用滑动窗口实现流量控制)
4、拥塞控制: 当网络拥塞时,减少数据的发送。
5、ARQ(自动重发请求)协议: 每发完一个分组就停止发送,等待对方确认,在收到确认后再发下一个分组。
6、超时重传: 当 TCP 发出一个段后,它会启动一个定时器,等待目的端确认收到这个报文段。如果不能及时收到一个确认,将重发这个报文段。
如何使 UDP 做到可靠传输?
在应用层模仿传输层 TCP 的可靠传输性。
1、添加 seq/ack 机制,确保数据发送到端。
2、添加发送和接收缓冲区。
3、添加超时重传机制。