背景
TCP 传输数据时,不是一个包一个包传输,而是流式传输。可以理解为把发送的数据包内容都放到一起,会把数据当成连续的字节流发送,不会保留 "数据包边界"。
例如:
某发送端(客户端)分两次发,如,[包1:100字节] 和 [包2:200字节],接收端(服务端)可能一次收到 300字节(粘包),或分多次收到 50字节+250字节(拆包)。
所以写代码接收时如果直接按固定长度读取,很容易读错数据(比如把包 1 的后半部分和包 2 的前半部分当成一个包)。
解决方法
使用"长度前缀法",可以解决这个问题。
为了让接收端(服务端)知道 "每个数据包有多大",发送端(客户端)会在每个数据包的最开头,先发送一个 quint32 类型的长度前缀(占 4 字节),表示 "后续数据的字节数"。
例如:要发一个 100 字节的数据包,发送端实际发:[quint32(100)] + [100字节的数据]。
如下这个接收端(服务端)代码:
cpp
if (m_blockSize == 0) { // 步骤1:还没读取当前数据包的长度前缀
// 检查当前接收缓冲区中,是否至少有 4 字节(quint32的大小)
if (m_clientSocket->bytesAvailable() < (int)sizeof(quint32)) {
return; // 不够4字节,等待更多数据到达
}
in >> m_blockSize; // 步骤2:读取长度前缀,存入m_blockSize
}
// 步骤3:后续逻辑(检查是否有足够数据来读取m_blockSize长度的内容)
if (m_clientSocket->bytesAvailable() < m_blockSize) {
return; // 数据还没到齐,继续等待
}
// 读取数据
QByteArray data = m_clientSocket->read(m_blockSize); //只读取m_blockSize这么多
m_blockSize = 0;
关键细节:bytesAvailable() < sizeof(quint32)
- sizeof(quint32) == 4,表示长度前缀占 4 字节。
- 如果接收缓冲区的可用字节数 不足 4 字节,说明长度前缀还没完全收到(比如只收到 2 字节),此时强行读取会导致:
- 读取到不完整的数值(比如把 2 字节当 4 字节读,结果完全错误);
- 甚至触发程序崩溃(流读取越界)。
因此,必须先判断 bytesAvailable() >= 4,确保能读到完整的长度前缀。
通过 "先读长度前缀,再读数据内容" 的策略,解决 TCP 流式传输的粘包 / 拆包问题:
- 先等待至少 4 字节(长度前缀)到达,读取数据包的总长度 m_blockSize;
- 再等待至少 m_blockSize 字节到达,读取实际的数据内容;
- 确保每次处理的都是完整的数据包,避免解析错误。
如果省略 bytesAvailable() < sizeof(quint32) 的判断,当长度前缀未完全到达时就强行读取,会导致数据解析错误或程序崩溃。
附录
发送端(客户端)对应的代码:
cpp
// 发送文件信息
QByteArray data;
QDataStream stream(&data, QIODevice::WriteOnly);
stream.setVersion(QDataStream::Qt_5_12);
m_fileInfo.serialize(stream);
// 先发送数据大小,再发送数据内容
quint32 blockSize = data.size();
QByteArray block;
QDataStream out(&block, QIODevice::WriteOnly);
out.setVersion(QDataStream::Qt_5_12);
out << blockSize << data;
m_socket->write(block);
从中可知,在发送端(客户端)时,发送每个包头部都是数据大小,然后才是内容。通过这样的方式,让接收端(服务端)处理,接收数据。
