C++使用“长度前缀法”解决TCP“粘包 / 拆包”问题

背景

TCP 传输数据时,不是一个包一个包传输,而是流式传输。可以理解为把发送的数据包内容都放到一起,会把数据当成连续的字节流发送,不会保留 "数据包边界"。

例如:

某发送端(客户端)分两次发,如,[包1:100字节] 和 [包2:200字节],接收端(服务端)可能一次收到 300字节(粘包),或分多次收到 50字节+250字节(拆包)。

所以写代码接收时如果直接按固定长度读取,很容易读错数据(比如把包 1 的后半部分和包 2 的前半部分当成一个包)。

解决方法

使用"长度前缀法",可以解决这个问题。

为了让接收端(服务端)知道 "每个数据包有多大",发送端(客户端)会在每个数据包的最开头,先发送一个 quint32 类型的长度前缀(占 4 字节),表示 "后续数据的字节数"。

例如:要发一个 100 字节的数据包,发送端实际发:[quint32(100)] + [100字节的数据]。

如下这个接收端(服务端)代码:

cpp 复制代码
if (m_blockSize == 0) {  // 步骤1:还没读取当前数据包的长度前缀
    // 检查当前接收缓冲区中,是否至少有 4 字节(quint32的大小)
    if (m_clientSocket->bytesAvailable() < (int)sizeof(quint32)) {
        return;  // 不够4字节,等待更多数据到达
    }
    in >> m_blockSize;  // 步骤2:读取长度前缀,存入m_blockSize
}

// 步骤3:后续逻辑(检查是否有足够数据来读取m_blockSize长度的内容)
if (m_clientSocket->bytesAvailable() < m_blockSize) {
    return;  // 数据还没到齐,继续等待
}

// 读取数据
QByteArray data = m_clientSocket->read(m_blockSize);    //只读取m_blockSize这么多
m_blockSize = 0;

关键细节:bytesAvailable() < sizeof(quint32)

  • sizeof(quint32) == 4,表示长度前缀占 4 字节。
  • 如果接收缓冲区的可用字节数 不足 4 字节,说明长度前缀还没完全收到(比如只收到 2 字节),此时强行读取会导致:
  • 读取到不完整的数值(比如把 2 字节当 4 字节读,结果完全错误);
  • 甚至触发程序崩溃(流读取越界)。

因此,必须先判断 bytesAvailable() >= 4,确保能读到完整的长度前缀。

通过 "先读长度前缀,再读数据内容" 的策略,解决 TCP 流式传输的粘包 / 拆包问题:

  1. 先等待至少 4 字节(长度前缀)到达,读取数据包的总长度 m_blockSize;
  1. 再等待至少 m_blockSize 字节到达,读取实际的数据内容;
  1. 确保每次处理的都是完整的数据包,避免解析错误。

如果省略 bytesAvailable() < sizeof(quint32) 的判断,当长度前缀未完全到达时就强行读取,会导致数据解析错误或程序崩溃。

附录

发送端(客户端)对应的代码:

cpp 复制代码
// 发送文件信息
QByteArray data;
QDataStream stream(&data, QIODevice::WriteOnly);
stream.setVersion(QDataStream::Qt_5_12);
m_fileInfo.serialize(stream);

// 先发送数据大小,再发送数据内容
quint32 blockSize = data.size();
QByteArray block;
QDataStream out(&block, QIODevice::WriteOnly);
out.setVersion(QDataStream::Qt_5_12);
out << blockSize << data;

m_socket->write(block);

从中可知,在发送端(客户端)时,发送每个包头部都是数据大小,然后才是内容。通过这样的方式,让接收端(服务端)处理,接收数据。

相关推荐
清水白石0087 分钟前
解构异步编程的两种哲学:从 asyncio 到 Trio,理解 Nursery 的魔力
运维·服务器·数据库·python
chilavert31826 分钟前
技术演进中的开发沉思-302计算机原理:网络基础
网络·计算机原理
码农小韩32 分钟前
基于Linux的C++学习——动态数组容器vector
linux·c语言·开发语言·数据结构·c++·单片机·学习
Hellc00737 分钟前
Docker网络冲突排查与解决方案:完整指南
网络·docker·容器
hui函数1 小时前
如何解决 pip install 编译报错 g++: command not found(缺少 C++ 编译器)问题
开发语言·c++·pip
代码游侠1 小时前
应用——智能配电箱监控系统
linux·服务器·数据库·笔记·算法·sqlite
眠りたいです1 小时前
Docker核心技术和实现原理第二部分:docker镜像与网络原理
运维·网络·docker·容器
Tisfy1 小时前
网站访问耗时优化 - 从数十秒到几百毫秒的“零成本”优化过程
服务器·开发语言·性能优化·php·网站·建站
2501_933513041 小时前
Linux下载离线rpm和依赖包的方法
linux·运维·服务器
闲人编程1 小时前
消息通知系统实现:构建高可用、可扩展的企业级通知服务
java·服务器·网络·python·消息队列·异步处理·分发器