分布式技术专题 | TCP在分布式网络中的通信机制与底层实现

跨地域通信与资源共享

计算机网络,作为现代通信技术与计算机技术融合的杰出产物,它通过各类通信线路将遍布全球的计算机紧密相连,构建成一个功能强大的网络系统。在这个网络中,计算机可以轻松地相互通信,实现硬件、软件和数据资源的共享。简而言之,计算机网络就是通过各种有线或无线设施连接起来的计算机集合。

网络节点与主机的定义

在计算机网络中,每一个连接的设备都被称为节点。这些节点不仅包括计算机,还涵盖了打印机、路由器、网桥、网关和哑终端等多种设备。为便于区分,本书将网络中的计算机节点特别称为"主机",而将其他设备统称为"节点"。

网络技术通信机制

人们早已习惯了一个简单的动作------打开浏览器,输入URL地址,随后,远程Web服务器上的网页内容便如魔法般呈现在我们眼前。这一过程的背后,其实蕴含着网络编程的精髓。网络编程的核心任务之一,便是开发类似于浏览器的客户端程序和Web服务器这样的服务器端程序,确保两者能够高效、有序地交换数据,这一切所实现的基础就是TCP/IP协议,接下来我们要针对性分析

TCP/IP协议模型

传输控制协议(TCP)作为一种基于流的网络通信方式,TCP/IP模型的发展可追溯至美国国防部高级研究计划局(ARPANET)及后续的Internet。ARPANET最初仅连接了美国境内的四所大学,随后迅速扩展,通过租用电话线连接了数百所大学和政府部门。最终,它发展成为全球最具影响力的互联网------Internet。

TCP/IP模型在保持网络分层思想的基础上,进行了层次简化,并在除主机-网络层外的各层提供了全面的协议支持,形成了TCP/IP协议集。这一协议集凭借其高效性和实用性,已成为当前最受欢迎的商业化协议,并在全球范围内确立了其工业标准或"事实标准"的地位。

TCP/IP分层机制

TCP通过确保可靠递交和定序,为支持双向通信的客户与服务器之间提供了稳定的字节流通信,进而减轻了额外的操作负担。该协议在两台设备间构建了一个"虚拟连接",使得数据流能够顺畅地通过这个连接进行传输。 TCP利用低级的通信协议(即IP协议)在设备间建立连接。这种连接为字节流的发送和接收提供了接口,同时能够透明地将数据转换为IP数据报包。当然,网络故障仍有可能影响数据的递交,但TCP通过处理重发包等问题来应对这一挑战,并且仅在出现严重情况,如无法路由到网络主机或连接丢失时,才会通知程序员。

TCP的Socket链接处理控制

两台机器之间的TCP连接是通过套接字来表示的。TCP套接字是与特定的一台机器建立的连接,而UDP套接字则可以从多台机器发送或接收数据。 其次,UDP套接字仅限于发送和接收数据包,而TCP则允许通过字节流(由InputStream和OutputStream表示)来传输数据。这些数据流在网络中传输时会被转换为数据报包,而这一过程并不需要程序员的直接干预。

TCP的优势和特性

TCP流上的数据传输相较于UDP信息包传输,具有更高的可靠性。TCP通过虚拟连接发送数据,这些数据包含校验和,以确保数据的完整性,这一点与UDP相似。但TCP的优越之处在于,它提供了数据递交的保证:若在传输过程中数据包丢失,TCP会进行重传,从而确保数据的准确送达。这种机制使得TCP在数据传输的可靠性方面显著优于UDP。

自动差错控制

当TCP通过数据报发送数据集时,会自动启动一个定时器。在TCP协议中,一旦接收方发出确认信息,该定时器就会停止。

如果在定时器设定的时间内没有收到确认,数据包将会被重新发送。这确保了通过TCP套接字写入的数据,在无需程序员进一步干预的情况下(除非遇到使整个网络瘫痪的极端情况),能够可靠地到达通信的另一端。此外,所有用于差错控制的代码处理都由TCP协议自动完成。

正确性和有序性

由于TCP连接中的数据传输是通过IP数据报实现的,这可能导致数据报包在两台通信的机器之间以乱序到达。对于从TCP套接字读取信息的程序而言,这种乱序到达可能会造成困扰,因为字节流的原本顺序可能被打乱,从而影响数据的可靠性。

TCP协议能够处理这类定序问题。每个数据报包都附带一个序列号,这个序列号用于对数据进行排序。如果后发送的数据在先发送的数据之前到达,它们将被暂时存放在队列中,直到可以确保数据的顺序性。只有当数据可以按照正确的顺序排列时,才会通过套接字接口传递给应用程序。这一机制确保了数据的正确性和有序性。

TCP的Socket使用端口在应用程序间通信

TCP这采用了通信端口的概念来区分不同的应用程序。许多服务和客户端在同一端口上运行,如果没有端口号进行区分,我们将无法识别它们。 当TCP套接字与另一台机器建立连接时,它需要两个关键信息来连接到远程终端:机器的IP地址和端口号。此外,TCP套接字还会绑定一个本地IP地址和端口号,以便远程机器能够识别是哪个应用程序建立了连接。

TCP的Socket使用端口

在TCP中,端口的概念与UDP中的端口相似,均由1至65536之间的数字来表示。其中,小于1024的端口被预留给诸如HTTP、FTP、SMTP、POP3和telnet等广为人知的服务使用。下图详细列出了一些这样的知名服务及其对应的端口号。

套接字操作

客户端 - TCP套接字具备多种功能,包括:与远程主机建立连接、向远程主机发送数据、从远程主机接收数据,以及关闭连接。 服务端 - TCP套接字还可以执行以下操作:绑定至本地端口,以接受来自远程主机的连接请求;并在完成任务后,从本地端口解除绑定。同时,它还能够接受和处理远程主机的传入连接。

这两种套接字被归入不同的类别,供客户端或服务器使用(尽管某些客户端也可以作为服务器,某些服务器也可作为客户端)。但通常的做法是将客户端和服务器进行区分。

相关推荐
这里有鱼汤9 分钟前
数据分析从入门到放飞:Python三大金刚来助阵!
后端·python
Y编程小白19 分钟前
SpringBoot的创建方式
java·spring boot·后端
基哥的奋斗历程21 分钟前
初识Go语言
开发语言·后端·golang
潜意识起点37 分钟前
【潜意识Java】javaee中的SpringBoot在Java 开发中的应用与详细分析
java·spring boot·后端
自在的LEE1 小时前
当 Go 遇上 Windows:15.625ms 的时间更新困局
后端·kubernetes·go
繁川2 小时前
深入理解Spring AOP
java·后端·spring
运维&陈同学4 小时前
【Elasticsearch05】企业级日志分析系统ELK之集群工作原理
运维·开发语言·后端·python·elasticsearch·自动化·jenkins·哈希算法
ZHOUPUYU5 小时前
最新 neo4j 5.26版本下载安装配置步骤【附安装包】
java·后端·jdk·nosql·数据库开发·neo4j·图形数据库
Q_19284999066 小时前
基于Spring Boot的找律师系统
java·spring boot·后端
ZVAyIVqt0UFji7 小时前
go-zero负载均衡实现原理
运维·开发语言·后端·golang·负载均衡