一、项目场景:
在本项目中,搭建了ABB机器人与Qt上位机之间的Socket通信,可以实现用上位机给机器人发送指令,机械臂接受指令后自动移至目标位姿,再给上位机反馈已到达指定位姿,上位机收到后可以控制其他设备开始工作,例如:焊枪,喷枪,扫描相机,当其他设备完成作业后,上位机再自动给机器人发下一个移动的指令,依次循环。实现使用上位机控制ABB机器人的自动化作业。相关背景可以查看 Qt制作简易上位机实现与ABB机器人的Socket通信 ABB机器人与上位机进行Socket通信的RAPID代码实现(服务端)
二、问题描述:
在进行Qt程序调试时发现,Socket通信建立好后,在其他detec.cpp中调用robotsocket.cpp中的子函数sendmessage()时,客户端(上位机)第一次可以给服务端发送指令,但是当第二次调用sendmessage()时,Socket通信连接失效,程序异常终止。 但是在robotsocket.cpp中反复调用sendmessage()也没有出现连接中断的情况。 调试了3天,网上各种办法也试了,第二次给服务端传输就是发不出去。
三、原因分析:
1. 排除
在排除了其他设备和服务器导致的原因后,最后把范围锁定在TCP/IP传输出现的问题上。
2. debug
先是在Qt上debug,发现程序在第二次运行至 clientSocket->write("move"); 后就异常终止了。
3. 抓包
使用抓包软件wireshark分析传输过程,下图是正常传输时的TCP/IP三次握手以及服务端和客户端互相发数据: 但是抓包异常终止的程序时发现,在第二次调用sendmessage()时,服务端给客户端发送了一个ACK后,客户端给服务端发了一个FIN,这不是程序本来应该执行的,很明显这就是导致连接中断的原因。
4. 异常中断原因
通过上网查资料,有可能是栈溢出和越界。 由于在每次发送数据后都会刷新缓存区,排除栈溢出
void RobotSocket::SendMessage1()
{
qDebug()<<"11";
clientSocket->write("move");
clientSocket->flush();
}
越界的话就是全局变量的声明没加static的原因,修改后发现程序便可以反复发送数据给服务端了。
四、解决方案:
1. 修改程序
导致上诉现象主要全局变量的声明没加static, 在相应的头文件中给clientsocket的声明中加上static
static QTcpSocket *clientSocket;
2. static的作用
复习一下static的作用: (1)在修饰变量的时候,static 修饰的静态局部变量只执行初始化一次,而且延长了局部变量的生命周期,直到程序运行结束以后才释放。 (2)static 修饰全局变量的时候,这个全局变量只能在本文件中访问,不能在其它文件中访问,即便是 extern 外部声明也不可以。 (3)static 修饰一个函数,则这个函数的只能在本文件中调用,不能被其他文件调用。static 修饰的变量存放在全局数据区的静态变量区,包括全局静态变量和局部静态变量,都在全局数据区分配内存。初始化的时候自动初始化为 0。 (4)不想被释放的时候,可以使用static修饰。比如修饰函数中存放在栈空间的数组。如果不想让这个数组在函数调用结束释放可以使用 static 修饰。 (5)考虑到数据安全性(当程序想要使用全局变量的时候应该先考虑使用 static)。
这次出现的问题就是使用完clientsocket后,就被释放了,所以要让clientsocket一直调用下去,就得加static。
warning:不要在头文件中声明static的全局函数,不要在cpp内声明非static的全局函数,如果你要在多个cpp中复用该函数,就把它的声明提到头文件里去,否则cpp内部声明需加上static修饰;
五、总结
本项目遇到的问题算比较小的问题,不过找bug的过程是非常痛苦的,问题越小,越不起眼,反而麻烦。 在这次debug的过程中,更说明一句话: 基础不牢,地动山摇 一定要好好把基础打好,养成良好的编程习惯。
|