要写出健壮、高可用性的程序,必须留心异常情况并逐一妥善处理。本文对从网络套接字读取数据的 recv 函数涉及的异常情况进行分析整理。当然,关于网络编程,网络方面的异常情况多种多样,这里不展开,只整理该函数本身相关的。
创建套接字后,调用该函数,需要注意检查其返回值。分三种情况进行处理:
- 返回值大于 0,表示本次调用读取到的字节数。如果已到达的数据是充足的,该值与参数中指定 len 值相等。否则将小于 len 值。
- 返回值等于 0。对于 TCP 连接来说,这表示对端已经关闭了连接。对于允许传输空数据帧的 socket 如 UDP 来说,返回 0 表示本次接收到空数据帧。
- 返回值等于 ?1。意味着某个错误发生了。具体的错误通过 errno 变量来指示代码。各代码的错误含义见下文整理。
错误代码
- EAGAIN or EWOULDBLOCK
- The socket is marked nonblocking and the receive operation would block, or a receive timeout had been set and the timeout expired before data was received. POSIX.1 allows either error to be returned for this case, and does not require these constants to have the same value, so a portable application should check for both possibilities.
- EAGAIN 与 EWOULDBLOCK 指向同一个错误代码。使用非阻塞方式创建 socket 后,调用 recv 进行读取时并还没有数据到达,就会设置该错误代码;或者使用 select、epoll 调用对 socket 进行监听,直到超时了还没有数据到达,也会设置该错误代码。其实这个并不算真正的“错误”,一般处理方法是再次调用 recv 进行读取,也就是 AGAIN 的含义。
- EBADF
- The argument sockfd is an invalid file descriptor.
- 调用 recv 时给定的第一个参数无效,可能是前一个步骤未能正确创建出 socket。
- ECONNREFUSED
- A remote host refused to allow the network connection (typically because it is not running the requested service).
- 对于 TCP,一般是在客户端发起连接时才可能出现该错误。而对于无连接的 UDP,调用 recv 出现该错误,很可能就是服务端还没初始化好,对应 IP 的主机并没有进程响应从该端口进入的数据。
- EFAULT
- The receive buffer pointer(s) point outside the process's address space.
- 这是指调用 recv 时第二个参数给定的地址是非法的。这是一般性的内存使用错误,和网络通信没有直接关系。
- EINTR
- The receive was interrupted by delivery of a signal before any data was available; see signal(7).
- 一般是在阻塞式读取,等待数据到达中,被系统中断打断,提前返回了。比如设定的超时时间触发。
- EINVAL
- Invalid argument passed.
- 参数不对。但这里不是指语法层面的,因为通过了编译器编译,现在出现的是运行时错误。一般是运行的状态不匹配,比如 socket 还没进行 listen 就进行 accept 操作。
- ENOMEM
- Could not allocate memory for recvmsg().
- 和 EFAULT 类似,一般性的内存问题。这里是无法申请到需要使用的内存。
- ENOTCONN
- The socket is associated with a connection?oriented protocol and has not been connected (see connect(2) and accept(2)).
- 对还没有连接的 TCP socket 进行读取。
- ENOTSOCK
- The file descriptor sockfd does not refer to a socket.
- 和 EBADF 类似,这里可以辨别出传入的 fd 不是一个 socket fd。
2021-08-24
|