一、问题:回声服务器真的可靠吗?
1.1 看似正确的回声客户端
我们之前实现了一个简单的回声客户端,核心代码如下:
c
write(sock, message, strlen(message)); // 发送消息
str_len = read(sock, message, BUF_SIZE-1); // 读取回声
message[str_len] = 0;
printf("Message from server: %s", message);
这个代码的隐含假设 是:每次 write 发送的数据,对方会一次 read 完整接收 。换句话说,我们认为 TCP 的数据传输像 UDP 一样有明确的消息边界------发送一次,接收一次。
然而,事实并非如此。
1.2 TCP 是流式协议
TCP(传输控制协议)是流式协议 ,它没有消息边界。这意味着:
- 多次
write发送的数据可能会被合并 成一个 TCP 数据包,一次read就能全部读到。 - 一次
write发送的数据可能会被拆分 成多个 TCP 数据包,需要多次read才能收完。
因此,我们的回声客户端可能会遇到两种情况:
- 粘包 :客户端发送
"Hello"和"World",服务器可能一次返回"HelloWorld",客户端一次read读到了两个字符串。 - 拆包 :客户端发送一个很长的字符串,服务器可能分两次返回,客户端第一次
read只读到前半部分,第二次才读到后半部分。
1.3 为什么之前的例子没有出错?
之前的例子之所以能正确运行,是因为:
- 数据量很小(通常小于 MTU,不会拆分)。
- 运行在本地或同一局域网,网络状况良好。
- 运气好,没有发生粘包。
但这不是可靠的程序,因为在实际网络中,这些问题一定会发生。
二、分析:数据边界丢失的根本原因
TCP 为了保证可靠传输,引入了滑动窗口 和流控制 机制,它将数据视为字节流,而不关心应用程序的消息边界。应用程序需要自己定义边界,常见的方法有:
- 定长消息:每个消息固定长度(如 4 字节),接收方循环读取直到凑够长度。
- 长度字段:消息前加一个固定长度的长度字段,告知后续数据大小。
- 分隔符 :用特殊字符(如
\n)分隔消息(例如 HTTP 协议)。
回声服务器的问题正是因为没有定义边界,所以客户端无法保证一次 read 就能收到完整消息。
三、解决:通过循环读取实现可靠接收
要解决这个问题,客户端必须知道要接收多少字节 ,然后循环调用 read 直到收满。
3.1 改进后的回声客户端(核心代码)
c
str_len = write(sock, message, strlen(message)); // 发送数据,记录发送字节数
recv_len = 0; // 已接收字节数
while (recv_len < str_len) // 直到收完所有字节
{
recv_cnt = read(sock, &message[recv_len], BUF_SIZE-1 - recv_len);
if (recv_cnt == -1)
error_handling("read() error");
recv_len += recv_cnt;
}
message[recv_len] = 0; // 字符串结束符
关键点:
- 发送方已知发送了多少字节(
str_len)。 - 接收方循环读取,直到累计读取的字节数等于
str_len。 - 使用
&message[recv_len]避免覆盖已读取的数据。
这种思路适用于客户端知道服务器会返回相同长度数据的回声服务。对于更复杂的协议,我们需要更灵活的边界定义。
四、拓展实战:计算器网络服务
下面我们通过一个计算器例子,展示如何设计自定义协议,实现可靠的网络通信。
4.1 需求描述
- 客户端连接服务器后,先以1字节整数告诉服务器要计算多少个数字。
- 接着客户端发送每个数字(4字节整数)。
- 最后发送运算符(1字节 ,
+、-、*)。 - 服务器计算后,以4字节整数返回结果。
4.2 协议设计
协议如下(按顺序发送):
| 字段 | 字节数 | 说明 |
|---|---|---|
| 操作数个数 | 1 | 例如 3 |
| 操作数1 | 4 | 例如 10 |
| 操作数2 | 4 | 例如 20 |
| ... | ... | ... |
| 操作数N | 4 | 最后一个操作数 |
| 运算符 | 1 | '+', '-', '*' |
服务器端解析后,计算结果并返回 4 字节整数。
4.3 客户端实现(计算器客户端)
c
#include <stdio.h>
#include <stdlib.h>
#include <string.h>
#include <unistd.h>
#include <arpa/inet.h>
#include <sys/socket.h>
#define BUF_SIZE 1024
#define RLT_SIZE 4 // 结果占 4 字节
#define OPSZ 4 // 每个操作数占 4 字节
void error_handling(char *message);
int main(int argc, char *argv[])
{
int sock;
char opmsg[BUF_SIZE]; // 数据包缓冲区
int result, opnd_cnt, i;
struct sockaddr_in serv_adr;
if (argc != 3) {
printf("Usage : %s <IP> <port>\n", argv[0]);
exit(1);
}
// 创建套接字
sock = socket(PF_INET, SOCK_STREAM, 0);
if (sock == -1)
error_handling("socket() error");
// 连接服务器
memset(&serv_adr, 0, sizeof(serv_adr));
serv_adr.sin_family = AF_INET;
serv_adr.sin_addr.s_addr = inet_addr(argv[1]);
serv_adr.sin_port = htons(atoi(argv[2]));
if (connect(sock, (struct sockaddr*)&serv_adr, sizeof(serv_adr)) == -1)
error_handling("connect() error!");
else
puts("Connected...........");
// 1. 输入操作数个数
fputs("Operand count: ", stdout);
scanf("%d", &opnd_cnt);
opmsg[0] = (char)opnd_cnt; // 第一个字节存放操作数个数
// 2. 输入每个操作数(4字节整数)
for (i = 0; i < opnd_cnt; i++) {
printf("Operand %d: ", i+1);
scanf("%d", (int*)&opmsg[i*OPSZ + 1]); // 从偏移1开始存放操作数
}
// 3. 输入运算符
fgetc(stdin); // 清除换行符
fputs("Operator: ", stdout);
scanf("%c", &opmsg[opnd_cnt*OPSZ + 1]); // 运算符放在所有操作数之后
// 4. 发送数据包(总长度 = 1 + opnd_cnt*4 + 1)
write(sock, opmsg, opnd_cnt*OPSZ + 2);
// 5. 接收结果(4字节)
read(sock, &result, RLT_SIZE);
printf("Operation result: %d \n", result);
close(sock);
return 0;
}
void error_handling(char *message) {
fputs(message, stderr);
fputc('\n', stderr);
exit(1);
}
4.4 服务器端实现(计算器服务器)
c
#include <stdio.h>
#include <stdlib.h>
#include <string.h>
#include <unistd.h>
#include <arpa/inet.h>
#include <sys/socket.h>
#define BUF_SIZE 1024
#define OPSZ 4
void error_handling(char *message);
int calculate(int opnum, int opnds[], char operator);
int main(int argc, char *argv[])
{
int serv_sock, clnt_sock;
char opinfo[BUF_SIZE]; // 接收客户端数据包的缓冲区
int result, opnd_cnt, i;
int recv_cnt, recv_len;
struct sockaddr_in serv_adr, clnt_adr;
socklen_t clnt_adr_sz;
if (argc != 2) {
printf("Usage : %s <port>\n", argv[0]);
exit(1);
}
// 创建监听套接字
serv_sock = socket(PF_INET, SOCK_STREAM, 0);
if (serv_sock == -1)
error_handling("socket() error");
// 绑定地址
memset(&serv_adr, 0, sizeof(serv_adr));
serv_adr.sin_family = AF_INET;
serv_adr.sin_addr.s_addr = htonl(INADDR_ANY);
serv_adr.sin_port = htons(atoi(argv[1]));
if (bind(serv_sock, (struct sockaddr*)&serv_adr, sizeof(serv_adr)) == -1)
error_handling("bind() error");
// 监听
if (listen(serv_sock, 5) == -1)
error_handling("listen() error");
clnt_adr_sz = sizeof(clnt_adr);
// 迭代处理5个客户端
for (i = 0; i < 5; i++) {
opnd_cnt = 0;
// 接受连接
clnt_sock = accept(serv_sock, (struct sockaddr*)&clnt_adr, &clnt_adr_sz);
// 读取第一个字节(操作数个数)
read(clnt_sock, &opnd_cnt, 1);
// 循环读取后续数据,直到收完所有操作数和运算符
recv_len = 0;
while (opnd_cnt * OPSZ + 1 > recv_len) {
recv_cnt = read(clnt_sock, &opinfo[recv_len], BUF_SIZE - 1);
recv_len += recv_cnt;
}
// 计算(操作数放在opinfo中,运算符在最后一个字节)
result = calculate(opnd_cnt, (int*)opinfo, opinfo[recv_len - 1]);
// 返回结果
write(clnt_sock, (char*)&result, sizeof(result));
close(clnt_sock);
}
close(serv_sock);
return 0;
}
// 计算函数
int calculate(int opnum, int opnds[], char op)
{
int result = opnds[0], i;
switch (op) {
case '+':
for (i = 1; i < opnum; i++) result += opnds[i];
break;
case '-':
for (i = 1; i < opnum; i++) result -= opnds[i];
break;
case '*':
for (i = 1; i < opnum; i++) result *= opnds[i];
break;
}
return result;
}
void error_handling(char *message) {
fputs(message, stderr);
fputc('\n', stderr);
exit(1);
}
4.5 协议设计总结
计算器例子展示了如何自定义协议来明确消息边界:
- 先发送固定长度的元数据(操作数个数),接收方知道后续要读取多少数据。
- 再发送固定长度的操作数(每个4字节)。
- 最后发送固定长度的运算符(1字节)。
服务器通过循环读取,确保收完所有数据后才进行计算,从而避免了粘包/拆包问题。
五、总结
5.1 核心要点
- TCP 是流式协议,没有消息边界,发送和接收的次数不一定匹配。
- 为了可靠通信,必须自己定义消息边界 ,例如:
- 定长消息
- 长度前缀
- 分隔符
- 接收方必须循环读取,直到收到完整消息。
5.2 拓展方向
- 并发服务器 :使用
fork()或pthread同时服务多个客户端。 - I/O 复用 :使用
select()或epoll()管理多个连接。 - 更复杂的协议 :例如自定义应用层协议(HTTP、FTP 等),通常采用长度字段 + 数据的方式。