【Net】TCP粘包与半包

文章目录

  • TCP粘包与半包
    • [1 背景](#1 背景)
    • [2 粘包(packet stick)](#2 粘包(packet stick))
    • [3 半包(packet split)](#3 半包(packet split))
    • [4 为什么会出现粘包/半包?](#4 为什么会出现粘包/半包?)
    • [5 如何解决?](#5 如何解决?)
    • [6 示例](#6 示例)
    • [7 总结](#7 总结)

TCP粘包与半包

在网络编程中,粘包半包问题是常见的 TCP 协议特有问题,尤其在基于流的传输协议中(如 TCP),它们常导致接收端无法正确还原发送端原本的一条条消息。


1 背景

TCP 是"字节流"协议,不保留消息边界,它只是一个字节流协议,只保证字节的顺序和完整性,但不关心应用层每条消息的边界。这就导致了"粘包"和"半包"的出现。


2 粘包(packet stick)

定义多条数据包被粘在一起,接收端一次接收到了多条消息数据。

举例:

客户端连续发送两条消息:

text 复制代码
[hello][world]

由于 TCP 是流式协议,可能在接收端变成:

text 复制代码
[helloworld]

此时接收端无法确定 "hello" 和 "world" 的边界。


3 半包(packet split)

定义一条完整的数据被拆成了几部分接收,接收端一次只能收到其中的一部分。

举例:

客户端发送一条 10 字节的消息:

text 复制代码
[helloworld]

可能接收端第一次 recv 只收到:

text 复制代码
[hello]

下一次再收到:

text 复制代码
[world]

也就是说,一条消息被拆成了"半包"。


4 为什么会出现粘包/半包?

  • TCP 特性导致:
    1. TCP 是字节流,不维护消息边界;
    2. Nagle 算法 会将小包合并发送(导致粘包);
    3. 接收端 buffer 缓冲区大小不确定,一次 read/recv 可能读不到完整数据(导致半包);
    4. 操作系统的发送/接收策略 也会影响包的合并与拆分。

5 如何解决?

  • 通用思路:在应用层实现消息边界的识别机制

    以下几种常见方案可以避免粘包/半包问题:

    1. 定长协议

      • 每条消息固定长度(例如每条消息都是 128 字节)。
      • 优点:实现简单;
      • 缺点:浪费带宽,不适用于变长消息。
    2. 添加分隔符

      • 每条消息结尾加特定分隔符(如 "\r\n")。
      • 接收端通过查找分隔符来拆分消息;
      • 缺点:消息内容中不能出现分隔符。
    3. 长度前缀协议(最常用)

      • 每条消息前加一个固定长度的字段表示消息体长度(如 4 字节整数):

        text 复制代码
        [4字节长度][消息体]

        示例:

        text 复制代码
        [00000005][hello]
        [00000005][world]
        • 接收端读取前 4 字节判断消息长度,再读取对应长度的消息体,精确拆包。

6 示例

C++ 实现的长度前缀协议收发逻辑示例,适用于基于 TCP 的客户端或服务器程序,用于解决粘包/半包问题。


  • 协议格式

    [4字节消息长度][消息体内容]

    • 消息长度为 uint32_t(网络字节序)

  • 核心发送/接收逻辑

发送端逻辑(附加长度前缀)

cpp 复制代码
#include <arpa/inet.h> // htonl
#include <string>
#include <unistd.h>    // write

bool sendMessage(int sockfd, const std::string& message) {
    uint32_t len = htonl(message.size()); // 转为网络字节序
    std::string packet;
    packet.append(reinterpret_cast<const char*>(&len), sizeof(len)); // 4字节长度
    packet.append(message); // 实际消息体

    size_t totalSent = 0;
    while (totalSent < packet.size()) {
        ssize_t sent = write(sockfd, packet.data() + totalSent, packet.size() - totalSent);
        if (sent <= 0) return false;
        totalSent += sent;
    }
    return true;
}

接收端逻辑(支持粘包/半包)

cpp 复制代码
#include <arpa/inet.h> // ntohl
#include <unistd.h>    // read
#include <vector>
#include <string>

bool recvExact(int sockfd, void* buffer, size_t length) {
    size_t total = 0;
    while (total < length) {
        ssize_t n = read(sockfd, (char*)buffer + total, length - total);
        if (n <= 0) return false; // 连接关闭或出错
        total += n;
    }
    return true;
}

bool recvMessage(int sockfd, std::string& outMessage) {
    uint32_t len_net;
    if (!recvExact(sockfd, &len_net, sizeof(len_net))) return false;

    uint32_t len = ntohl(len_net);
    if (len > 10 * 1024 * 1024) return false; // 限制最大消息长度,防止攻击

    std::vector<char> buffer(len);
    if (!recvExact(sockfd, buffer.data(), len)) return false;

    outMessage.assign(buffer.begin(), buffer.end());
    return true;
}

客户端完整用法

cpp 复制代码
std::string msg = "hello world";
sendMessage(sockfd, msg);

std::string received;
if (recvMessage(sockfd, received)) {
    std::cout << "Received: " << received << std::endl;
}

说明与扩展建议

项目 说明
字节序 使用 htonl/ntohl 保证跨平台兼容
粘包支持 多条消息合并也能正确拆分
半包支持 recvExact 保证完整读取
安全性 应添加最大长度检查,防止恶意攻击
异步扩展 可结合 epoll 实现非阻塞版本

7 总结

问题 表现 原因 解决方式
--------
粘包 多条消息合并 TCP 合并包 定长、分隔符、长度前缀
半包 一条消息被拆开 TCP 拆包 接收端维护 buffer,支持多次接收拼接
相关推荐
GalaxyPokemon1 小时前
RPC-Client模块
网络·网络协议·rpc
chirrupy_hamal2 小时前
如何避免 SYN 攻击?
网络·tcp
DemonAvenger2 小时前
Go语言中的TCP编程:基础实现与最佳实践
网络协议·架构·go
怦然星动_2 小时前
ip网络基础
网络·智能路由器
数据与人工智能律师2 小时前
数字资产革命中的信任之锚:RWA法律架构的隐形密码
大数据·网络·人工智能·云计算·区块链
菜包eo3 小时前
二维码驱动的独立站视频集成方案
网络·python·音视频
yzx9910133 小时前
关于网络协议
网络·人工智能·python·网络协议
zsq4 小时前
【网络与系统安全】域类实施模型DTE
网络·安全·系统安全
00后程序员张6 小时前
免Mac上架实战:全平台iOS App上架流程的工具协作经验
websocket·网络协议·tcp/ip·http·网络安全·https·udp
喜欢板砖的牛马6 小时前
简述IPv4分配过程,看这一篇就够了
网络协议