Error
Traceback (most recent call last):
File "/usr/lib/python3.5/threading.py", line 914, in _bootstrap_inner
self.run()
File "/usr/lib/python3.5/threading.py", line 862, in run
self._target(*self._args, **self._kwargs)
File "/home/zt/CI/MasterController/MainControllerServer.py", line 115, in main_control
wait_ack(crawler_client_sock)
File "/home/zt/CI/MasterController/TcpUtil.py", line 23, in wait_ack
recv_data = recv_end(sock)
File "/home/zt/CI/MasterController/TcpUtil.py", line 38, in recv_end
data = sock.recv(4096).decode('utf-8')
ConnectionResetError: [Errno 104] Connection reset by peer
解决思路
网络编程通信出现了连接被对方reset了的情况,为了debug分别查看了server和client端对应的端口状态。一端显示ESTABLISHED,而另一端由于进程挂掉已经没了连接,这就很奇怪了。怎么可能一端建立连接,一端连接不见了。
仔细分析之后发现,我的服务器处于实验室的内部网络,存在防火墙,外部客户端是与防火墙的代理建立的连接,所以出现了一端建立连接另一端断开了。
所以并不是通信的另一端进行了reset,而是防火墙进行了reset,找到原因之后通过百度,查到防火墙会对长时间不进行通信的tcp连接进行关闭,所以需要对长连接进行一些处理。
解决方法
采取心跳机制,设置socket每隔一段时间就探测对方是否存在,从而保持连接存在。但是默认的socket心跳机制是2个小时无通信再探测,可能比防火墙设置的超时时间要长,所以需要修改心跳机制的参数。
我的运行环境是ubuntu + python 3.5 修改套接字选项,设置好心跳机制后就解决了这个问题。
client = socket.socket(socket.AF_INET, socket.SOCK_STREAM)
client.setsockopt(socket.SOL_SOCKET, socket.SO_KEEPALIVE, 1)
client.setsockopt(socket.SOL_TCP, socket.TCP_KEEPIDLE, 600) # 覆盖tcp_keepalive_time 表示多久时间未通信后进行探测
client.setsockopt(socket.SOL_TCP, socket.TCP_KEEPCNT, 10) # 覆盖tcp_keepalive_probes 探测次数
client.setsockopt(socket.SOL_TCP, socket.TCP_KEEPINTVL, 30) # 覆盖tcp_keepalive_intvl 每次探测的超时时间
client.connect((host, port))
如果长时间未通信则启用心跳机制,如果进行多次探测之后,每一次都超时了则表示对方已关闭连接(也有可能是网络问题),此时关闭连接。
TCP keepalive 详解 - 简书 linux下TCP keepalive 属性设置_sunxiaopengsun的专栏-CSDN博客
|