TCP粘/拆包----自定义消息协议

今天是2024年12月31日,今年的最后一天,希望所有的努力在新的一年会有回报。❀

无路可退,放弃很难,坚持很酷

TCP传输

是一种面向二进制的,流的传输 。在传输过程中最大的问题是消息之间的边界不明确 。而在服务端主要的问题就是读取TCP连接的时候,不确定一次会读到多少数据

TCP会使用某些算法如Nagle,将多个量小,独立的数据包合并为一个报文段(大包)进行发送,以提高效率,而这些独立的数据之间没有明确的边界,服务端会出现几种情况

假如报文段中有两个独立的数据包AB,较理想的情况是服务端分别读取到了这两个包[A],[B]。

其次服务端把这两个包作为一个整体读取到了,此时这两个包成为一个整体状态[AB],即粘包

服务端读取到了整个A包,以及B包的一部分,此时就发生了拆包

还可能会有其他原因,比如发送的数据包,超过了最大报文段的长度MSS(1460byte),此时大包也会被拆包。

说到底都是因为TCP传输是基于字节流进行传输的,不会维护消息之间的边界

解决方案:

自定义消息传输协议,在消息前加一个长度,服务端按长度读取。

自定义一个消息传输的协议对象,后续的编解码都基于此

配置服务端,客户端启动:依旧是按照Netty那套模型来....省略

主要是需要自定义一个编解码器 ,因为传输的是自定义的对象,而Netty默认的channelHandler**只会传输字节流数据。**需要手动编解码进行处理。

出站编码器:

write方法会将对象数据以字节的形式写入byteBuf并发送

(编码器只会对规定的数据类型进行编码,类型外直接发送)

入站解码器:

解码器接收到的是字节流,将它转为消息对象。

readInt会先读取长度,再根据长度去读取字节内容

解码完成后通过list交给下一个handler处理

ReplayingDecoder 会自动缓存字节数据并管理读取指针。如果数据还没读取完,它会在下次调用 decode() 时继续从正确的位置读取,而你不需要手动管理指针的移动。无需手动判断readableBytes了,它会根据协议和读取的字节自动管理数据的边界

Void 就是一个占位符,表示无需任何状态(如当前解码的消息长度、已读取的字节数等对象,可在后续解码过程中继续处理)来辅助解码过程。

将编码器以及处理器依次加入到channel的pipeLine

双方处理流程:

1,处理器发送消息对象,消息传递给下一个handler即编码器,编码为字节流然后网络发送。

2,解码器收到网络二进制消息流,解码为消息对象,传递给下一个handler处理消息。

现在客户端发送了十个消息对象,为了方便看问题,加一个计数器统计消息的数量:

刚好十条。

如果粘包或者拆包的话,就不会打印出十条消息数量,如这种情况:

相关推荐
草莓熊Lotso4 小时前
Linux 线程深度剖析:线程 ID 本质、地址空间布局与 pthread 源码全解
android·linux·运维·服务器·数据库·c++
IpdataCloud4 小时前
风控策略误杀正常用户?如何用IP离线库多维特征优化规则阈值
网络·tcp/ip·安全·ip
TechWayfarer4 小时前
移动网络IP定位难题:4G/5G用户的IP为什么老飘?
网络·tcp/ip·5g
草莓熊Lotso5 小时前
MySQL 从入门到实战:视图特性 + 用户权限管理全解
linux·运维·服务器·数据库·c++·mysql
zmjjdank1ng6 小时前
OSI模型和TCP/IP模型
服务器·网络·tcp/ip
Dream of maid12 小时前
Python12(网络编程)
开发语言·网络·php
菜菜艾13 小时前
基于llama.cpp部署私有大模型
linux·运维·服务器·人工智能·ai·云计算·ai编程
重生的黑客13 小时前
Linux开发工具:条件编译、动静态库与 make/makefile 入门
linux·运维·服务器
minji...14 小时前
Linux 线程同步与互斥(三) 生产者消费者模型,基于阻塞队列的生产者消费者模型的代码实现
linux·运维·服务器·开发语言·网络·c++·算法
航Hang*14 小时前
VMware vSphere 云平台运维与管理基础——第2章(扩展):VMware ESXi 5.5 安装、配置与运维
运维·服务器·github·系统安全·虚拟化