僵尸进程
(1)进程中的指令已经执行完成,但是进程PCB结构还没有回收。 即子进程先于父进程退出后,子进程的PCB需要其父进程释放,但是父进程并没有释放子进程的PCB,这样的子进程就称为僵尸进程。 (2)父进程未结束,子进程结束,但父进程没有处理子进程的退出状态(当子进程先于父进程结束,父进程没有获取子进程的退出码,子进程的PCB会保留一段时间等待父进程在PCB中获取退出码,,且该进程不可执行,此时子进程变成僵尸进程)。 直到父进程获取到子进程的退出状态,子进程的PCB才会被移除。
我们的程序在退出的时候:return 0,exit(0),这个0就是退出码(状态信息),它存储在当前进程的PCB中,会有一个整型值来存储退出码。 当我们子进程结束以后,会把退出码写到PCB中,然后希望父进程可以获得到这个退出码,然后父进程就可以看到子进程是正常运行结束还是出错退出。正常的话我们return 0,失败的话我们return -1。
模拟僵尸进程:
僵死进程产生了,会有什么影响?
- 如果只有一两个僵死进程,没有什么影响。
- 如果有很多个僵死进程,持续不断的产生,就有影响了,因为子进程的PCB如果没有被释放,进程的PID就被一直占着,在内核空间中,PCB本身是结构体,会占用内存空间,对系统软硬件资源损耗,因此我们要避免僵死进程的产生,父进程有义务去处理!
如何处理僵尸进程
- 父进程调用
wait() 方法获取子进程的退出码,从而使得OS删除子进程的PCB; - 父进程先结束(该子进程就失去了父进程,系统会将这种没有子进程的父进程当做孤儿进程OS会给该孤儿进程重新寻找一个父进程Init进程,其PID == 1,通常会收养那些没有父进程的子进程,就会直接获取其退出码从而消除该进程的僵死状态 [ 其内部其实也是调用了wait()方法] )
- 如下图所示,修改之前的代码,让父进程先于子进程结束
执行结果如下: 我们可以看到失去父进程的子进程的PPID变为1,也就是Init 进程
父进程处理子进程退出状态(退出码)的方法:
pid_t wait(int *result)
- 如果没有子进程,则调用失败;
- 如果有子进程并且已经结束,则返回子进程的PID,退出码在result带回。
- 如果子进程没有结束,那么wait就会阻塞等待子进程结束。
我们来看一下wait的参考手册: 我们需要传入一个整形变量的地址,它会将退出码写到该地址中,返回值就是他获取到退出码的那个子进程的PID。 执行结果如下:这样就相当于父子进程是串行执行 的,因此我们不会很简单粗暴地调用wait(),失去了多进程执行的意义,常会使用一些巧妙的方法,比如配合信号使用,这个在后面的博客中将会提到。
出现这种现象的原因是:父进程需要获取子进程的退出码,就需要等待子进程先结束,既然子进程没有结束,就无法获取子进程的退出码,wait()方法就相当于阻塞了父进程的运行。
- 如果有多个子进程,一次wait调用只能处理一个子进程(最先结束的哪一个)。
如下代码也用wait处理了僵尸进程,但我们需要解决另外一个问题: 注意:此时我们exit(0)的退出码是0 此时val的值为0 但是当我们将退出码改为3时,执行结果发生了变化,我们可以看到val = 768 这是为什么呢? 其实768对应的二进制数为0011 0000 0000,(11就是那个3) ——左移了8位,因为退出码一般来说是128以内的值,但是一个整型有4字节,1个字节本来就够存储退出码了,其他3个字节有别的作用了,所以在这里就发现被移位了,存储在该存储的位上。我们这怎么处理?操作位是不大方便的,但是系统给我们提供了一些方法
- 第一个宏是用来判断程序是否是正常exit退出
- 如果是正常退出,就通过第二个宏得出退出码,这个宏就知道我们的退出码是在4个字节中的哪个字节存放的,精准取值,此时拿到的就是我们设定的3了,不是768了。
当程序还没有执行到exit就被杀死,获取到异常终止的信号,我们就用下面这个宏来判断 使用宏后,我们修改代码如下: 之后就可以看到正常的执行结果了
wait调用的最佳时机:子进程退出的那一时刻,父进程调用wait; 这里引入一个概念,在下一期Linux专栏将会讲到信号
若在父进程一开始就调用,那么就会出现串行执行的效果; 若在父进程快要结束的时候调用,那么父进程已经退出,处理僵尸进程就没有意义了。
|