什么是分包粘包
TCP分包
场景:发送字符 hello world!,接收方却分别接收到了两个数据包:字符串”hello”和”world”,发送端发送了数量较多的数据,接收端读取数据时候数据分批到达,造成一次发送多次读取; 造成分包的原因: TCP是以段(Segment)为单位发送数据的,建立TCP链接后,有一个最大消息长度(MSS).如果应用层数据包超过MSS,就会把应用层数据包拆分,分成两个段来发送.
这个时候接收端的应用层就要拼接这两个TCP包,才能正确处理数据。
相关的,路由器有一个MTU( 最大传输单元)一般是1500字节,除去IP头部20字节,留给TCP的就只有MTU-20字节。所以一般TCP的MSS为MTU-20=1460字节
当应用层数据超过1460字节时,TCP会分多个数据包来发送。
粘包
发送端发送了几次数据,接收端一次性读取了所有数据,造成多次发送一次读取;通常是网络流量优化,把多个小的数据段集满达到一定的数据量,从而减少网络链路中的传输次数 造成TCP粘包的原因:
TCP为了提高网络的利用率,会使用一个叫做Nagle的算法.该算法是指,发送端即使有要发送的数据,如果很少的话,会延迟发送.如果应用层给TCP传送数据很快的话,就会把两个应用层数据包“粘”在一起,TCP最后只发一个TCP数据包给接收端.
解决方案,分包和粘包
发送数据前,给数据头部 加上 标识符 + 待发送数据的长度 + 待发送数据 FBEB 数据长度N 数据内容
- 包标识: 包头部的特殊标识,用来标识包的开始
- 数据长度:数据包的大小,固定长度,2、4 或者8字节。
- 数据内容:数据内容,长度为数据头定义的长度大小。
实际操作如下: 发送端:先发送包表示长度,在发送数据内容. 接收端:接收标识符,解析数据包长度 N,再读取这 N 个字节,这 N 个字节就是一个完整的数据内容。 具体流程如下:
测试代码案例
服务器端: server.c
#include <sys/un.h>
#include <sys/types.h>
#include <sys/socket.h>
#include <stdio.h>
#include <stdlib.h>
#include <netinet/in.h>
#include <arpa/inet.h>
#include <errno.h>
#include <unistd.h>
#define PORT 666
#define MAX_MESSAGE 1024
#define TAG_MSG "FBEB"
#define DATA_BYTES 4
void readpackge(int fd){
char buf[1024];
int current_read = 0;
int tag_len = strlen(TAG_MSG);
int read_len = read(fd, buf, tag_len + DATA_BYTES);
if(read_len < 0 ){
printf("read from client failed\n");
}
if(strncmp(buf,TAG_MSG,tag_len) == 0){
int need_read = *((int*)(buf + tag_len));
printf("needread:%d\n",need_read);
while(current_read < need_read){
current_read+= read(fd ,buf,need_read - current_read);
}
printf("read from client:%s\n",buf);
}
write(fd,buf,12);
}
int main(void){
sockaddr_in server_addr;
char *buf;
int fd = socket(AF_INET,SOCK_STREAM,0);
bzero(&server_addr, sizeof(server_addr));
server_addr.sin_family = AF_INET;
server_addr.sin_addr.s_addr = htonl(INADDR_ANY);
server_addr.sin_port = htons(PORT);
bind(fd, (struct sockaddr*)&server_addr, sizeof(server_addr));
listen(fd,128);
while(1){
char buffer[1024];
struct sockaddr_in client_sock;
socklen_t server_len = sizeof(client_sock);
int client_fd = accept(fd, (struct sockaddr*)& client_sock, &server_len);
printf("41\n");
if(client_fd < 0 ){
printf("bind failde \n");
exit(1);
}
readpackge(client_fd);
}
return 0;
}
cleint.cpp
#include <sys/un.h>
#include <sys/types.h>
#include <sys/socket.h>
#include <stdio.h>
#include <stdlib.h>
#include <netinet/in.h>
#include <arpa/inet.h>
#include <errno.h>
#include <string.h>
#include <unistd.h>
#define TAG_MSG "FBEB"
#define DATA_BYTES 4
#define PORT 666
#define SERVER_IP "192.168.142.128"
int main(int argv,char **argc){
sockaddr_in server_addr;
char *buf = NULL;
bzero(&server_addr,sizeof(server_addr));
memset(&server_addr,'\0',sizeof(server_addr));
int sock = socket(AF_INET,SOCK_STREAM,0);
server_addr.sin_family = AF_INET;
server_addr.sin_addr.s_addr = inet_addr("192.168.142.128");
server_addr.sin_port = htons(PORT);
connect(sock,(struct sockaddr*)&server_addr,sizeof(server_addr));
char *msg = "hello linux!";
int MSG_LEN = strlen(msg);
int tag_len = strlen(TAG_MSG);
buf = (char*)malloc(DATA_BYTES + tag_len + MSG_LEN);
strcpy(buf,TAG_MSG);
*((int*)(buf + tag_len)) = MSG_LEN;
memcpy(buf + DATA_BYTES + tag_len, msg,MSG_LEN);
printf("%s\n",buf);
int len = write(sock,buf,DATA_BYTES + tag_len);
len = write(sock,buf + DATA_BYTES + tag_len ,MSG_LEN);
if(len < 0){
printf("write to server failded\n");
exit(1);
}
len = read(sock,buf,len);
if(len < 0){
printf("read from len failded\n");
exit(1);
}
buf[len] = '\0';
printf("read from server:%s bytes:%d\n",buf,len);
close(sock);
return 0;
}
总结:再使用TCP通行中,再做工程级的项目时,都是采取的这种,标识符 + 数据长度 + 数据 的读取方式,标识符的选择一般根据实际选择,选择发送的数据几乎不可能出现的字符,我这里的演示案例选取的 “FBEB” 做为 TAG 标识。
|