【Linux网络】套接字Socket编程预备

前言:

上文我们讲到了,讲到了对于网络的初步认识,知道了网络一系列基本概念【Linux网络】初识网络,网络的基础概念-CSDN博客

本文正对上文的套接字,来认识套接字在函数接口的认识,在编程上的使用;最终模拟实现服务器与客户端,来深入理解套接字。


Socket编程预备

理解传入数据的目的

**IP地址在网络中标记主机唯一性。**源主机通过目标主机的IP地址,将数据传输给目标主机。

但将数据传输给主机是目的吗?不是!因为数据最终都是给人用的,将数据传输给主机只是手段。比如:QQ聊天,其实是人在聊;浏览网页数据,其实是人在浏览。

**那么,人应该如何获取对应的数据呢?通过启动对应的应用程序获得!**比如:想要获得聊天消息,就要启动QQ等聊天程序;想要获取网页数据,就要启动浏览器。

而对应的应用程序都是进程。换句话说,进程就是人在计算机中的代表,只要把数据交给对应的进程,就相当于交给了人。

所以,数据传输到主机并不是目的,而是手段;最终将数据交给对应的进程才是目的!

认识端口号

我们现在知道了数据传输给目标主机后,最终目的是将数据交给对应的进程。但是计算机中有不计其数的进程,如何交给正确的进程呢?端口号,正是解决这一问题的答案!

**端口号(port)**是传输层协议的内容。

端口号用于标识一台计算机中唯一的进程。其本质是一个2字节16位的整数。

一个端口号只能被一个进程占用,但一个进程可以拥有多个端口号。只需确保一个端口号对应唯一一个进程即可。

通过**IP地址 + 端口号,我们就可以得到全网唯一的一个进程!**于是我们惊讶的发现:网络通信的本质,其实就是进程间通信!

端口号范围划分

**0~1023:知名端口号,**如HTTP,FTP,SSH等。这些广为使用的应用层协议,它们的端口号都是固定的!

1024~65535:这个范围才是我们能够使用的端口号。 不过端口号是由OS动态分配的,我们并不能指定端口号。

理解端口号与PID

我们讲端口号port是标识计算机中唯一的进程,但是我们也知道PID也是标识计算机中唯一的进程。那为什么不使用PID,而又引用端口号来标识呢?

因为如果我们用PID代替端口号,那么操作系统与网络就会产生强耦合!而我们追求的高内聚,低耦合。所以就并没有这么做。

理解源端口号与目的端口号

传输成协议(TCP与UDP)的数据段中有两个端口号,分别叫做源端口号目标端口号 。其本质就是在描述:谁发送的数据、要发给谁。

理解套接字socket

我们上面讲到了IP + 端口号标识了全网唯一的一个进程

我们把 IP + 端口号 就叫做套接字socket,它能在整个网络里唯一确定一个进程,方便网络中不同进程通过它来通信。

简单认识传输层协议

传输层是属于OS内核的,用户想要调用任何接口,使用任何功能都必须调用对应的系统调用。传输层协议有两个经典代表:UDP、TCP

TCP协议

TCP(Transmission Control Protocol,传输控制协议)

其特点为:

**有链接:**通信前需要先建立链接。比如打电话,想要通信必须拨打电话并且等待对方接通。

**可靠传输:**确保数据准确有效到达。

**面向字节流:**以字节为单位传输数据。

UDP协议

UDP(User Dategram Protocol,用户数据报协议)

其特点为:

**无链接:**通信前不想要建立链接。比如对讲机,想要通信时直接发送信息即可,不需要等待谁。

**不可靠传输:**不确保数据准确有效到达。

**面向数据报:**以独立数据为单位传输。

网络字节序

我们知道计算机是分为大端机与小端机的。

大端机意思是,其内部的数据是按照大端存储的,既高位数据放在低地址处,低位数据放在高地址处。

小端机意思是,其内部的数据是按照小端存储的,既高位数据放在高地址处,低位数据放在低地址处。

发送数据的主机通常将缓冲区中的数据,按照内存地址从低到高发送。但对于大小端主机来说,就算是相同的数据,发送后也会变得不一样!

所以,为了保证大小端主机发送信息的一致性。TCP/IP协议规定:网络数据流应采用大端字节序。

不论大小端主机,都必须遵守这个协议。大端主机发送数据不影响,而小段主机发送数据时,必须先将数据转化为大端,再进行发送!

其中,为了让代码在不同的大小端机器上具备可移植性,我们可以使用以下库函数,来完成网络字节序与主机字节序的转化

cpp 复制代码
#include <arpa/inet.h>

//主机字节序 转 网络字节序
uint32_t htonl(uint32_t hostlong);
uint16_t htons(uint16_t hostshort);

//网络字节序 转 主机字节序
uint32_t ntohl(uint32_t netlong);
uint16_t ntohs(uint16_t netshort);

函数名很好记:
    h标识host,n表示network,l表示32为长整数,n表示16位短整数

如果主机是小端机,这些函数就会进行相应的转化
如果主机是大端机,这些函数将不会执行转化工作

Socket编程接口

cpp 复制代码
// 创建 socket ⽂件描述符 (TCP/UDP, 客⼾端 + 服务器) 
int socket(int domain, int type, int protocol);

// 绑定端⼝号 (TCP/UDP, 服务器) 
int bind(int socket, const struct sockaddr *address, socklen_t address_len);

// 开始监听socket (TCP, 服务器) 
int listen(int socket, int backlog);

// 接收请求 (TCP, 服务器) 
int accept(int socket, struct sockaddr* address, socklen_t* address_len);

// 建⽴连接 (TCP, 客⼾端) 
int connect(int sockfd, const struct sockaddr *addr, socklen_t addrlen);

Sockadd结构体

我们注意到在Socket接口中,存在参数为struct sockeaddr* 的参数。下面我们来认识一下这个参数。

套接字socket执行的通信标准是POSIX标准。而POSIX标准是包含了网络通信与本地通信的,这也就意味着执行这套标准的socket要支持多种通信方式

但socket的实现者,不想提供多个针对于不同通信的接口,只想提供一个接口来完成多种通信方式。于是结构体Sockeaddr诞生了!

通过结构体的内存布局兼容实现:struct sockaddr作为基类,struct sockaddr_in与struct sockaddr_un作为子类继承基类、实现多态的作用。struct sockaddr_in用于网络通信,struct sockaddr_un用于本地通信。这样就实现了一个接口多种通信功能。

相关推荐
JiMoKuangXiangQu13 分钟前
Linux 内存管理 (6):slub 分配器
linux·内存管理·slab
NetInside_14 分钟前
基于 Gartner 2025 报告:数字体验监测(DEM)核心价值与企业落地指南
运维·云原生
weixin_3077791321 分钟前
Jenkins 多分支流水线自动化引擎:GitHub Branch Source 插件完全指南
运维·架构·自动化·jenkins
_F_y22 分钟前
Linux中gdb的使用
linux
谢某清心寡欲34 分钟前
搭建Linux源码阅读环境
linux
孫治AllenSun42 分钟前
【Doris】运维命令
运维·服务器·网络
我科绝伦(Huanhuan Zhou)1 小时前
Oracle控制文件、SCN与检查点机制深度解析及数据库初始化原理
运维·数据库·oracle
杨云龙UP1 小时前
从0到可落地:Oracle RMAN异地NFS备份标准脚本(多实例通用)
linux·运维·数据库·oracle
*星星之火*1 小时前
【大白话 AI 答疑】第6篇 大模型指令微调:instruction/input/output核心解析及案例
服务器·前端·人工智能
黑客思维者1 小时前
嵌入式系统DevSecOps深度设计:构建固件级漏洞免疫体系的自动化管道
运维·自动化·devsecops·嵌入式系统