四、TCP粘包与拆包

来源：互联网发布：java cpu占用高分析编辑：程序博客网时间：2024/05/18 00:36

TCP是个“流”协议，所谓流，就是没有界限的一串数据。TCP底层并不了解上层业务数据的具体含义，它会根据TCP缓冲区的实际情况进行包的拆分，所以在业务上认为，一个完整的包可能会被TCP拆分成多个包进行发送，也有可能把多个小的包封装成一个大的数据包发送，这就是常说的TCP粘包和拆包问题。
一、TCP粘包和拆包问题
这里写图片描述
假设客户端分别发送了两个数据包D1和D2个服务端，由于服务端一次读取到的字节数是不确定的，因此可能存在以下四种情况：
(1)服务端分两次读取到了两个独立的数据包，分别是D1和D2，没有粘包和拆包。
(2)服务端一次接收到了两个数据包,D1和D2粘合在一起，被称为TCP粘包。
(3)服务端分两次读取到了两个数据包，第一次读取到了完整的D1包和D2包的部分内容，第二次读取到了D2包的剩余内容这被称为TCP拆包。
(4)服务端分两次读取到了两个数据包，第一次读取到了D1包的部分内容D1_1,第二次读取到了D1包的剩余内容D1_2和D2包的整包。

如果此时服务端TCP接收滑窗非常小，而数据包D1和D2比较大，很有可能会发生第五种可能，即服务端分多次才能将D1和D2包接收完全，期间发生多次拆包。

二、TCP粘包和拆包发生的原因
问题产生的原因有三个，分别如下：
(1)应用程序write写入的字节大小大于套接字发送缓冲区大小；
(2)进行MSS(Maximum Segment Size最大报文段长度长度)大小的TCP分段；
(3)以太网帧的payload(负载)大于MTU(最大传输单元)进行IP分片。
这里写图片描述
三、粘包问题的解决策略
由于底层的TCP无法理解上层的业务数据，所以在底层是无法保证数据包不被拆分和重组的，这个问题只能通过上层的应用协议栈设计来解决，根据业界的主流协议的解决方案，可以归纳以下几点：
(1)消息定长，例如每个报文的大小为固定长度200字节，如果不够，空位补空格。
(2)在包尾增加回车换行符进行分割，例如FTP协议；
(3)将消息分为消息头和消息体，消息头中包含表示消息总长度(或者消息体长度)的字段，通常设计思路为消息头的第一个字段使用int32来表示消息的总长度；
(4)更复杂的应用层协议。

通过了解TCP粘包和拆包的基础知识，后面通过实际例程看看如何使用Netty提供的半包解码器来解决TCP粘包和拆包问题。

阅读全文

0 0