一、进程创建
fork函数
在linux中fork函数时非常重要的函数,它从已存在进程中创建一个新进程。新进程为子进程,而原进程为父进程。 其中,fork创建子进程是以父进程为“模板”的。一个父进程可以创建出多个子进程。父:子=1:n,任何孩子都需要知道父亲,父亲需要去标识孩子。
返回值:子进程中返回0,父进程返回子进程id,出错返回-1
进程调用fork,当控制转移到内核中的fork代码后,内核做:
1.分配新的内存块和内核数据结构给子进程 2.将父进程部分数据结构内容拷贝至子进程 3.添加子进程到系统进程列表当中 4.fork返回,开始调度器调度
当一个进程调用fork之后,就有两个二进制代码相同的进程。而且它们都运行到相同的地方。
fork函数返回值
子进程返回0, 父进程返回的是子进程的pid。
写时拷贝
通常,父子代码共享,父子再不写入时,数据也是共享的,当任意一方试图写入,便以写时拷贝的方式各自一份副本,其中代码是共享的且不可被修改,如果各自私有就浪费空间。 数据为什么要私有一份呢? 因为进程之间具有独立性,一个进程在运行期间不会影响另一个进程。 数据很多,不是所有的数据都要立马使用,且不是所有的数据都需要进行拷贝。但是如果立马要独立,就需要将数据全部拷贝,把本来可以在后面拷贝的,甚至不需要拷贝的数据,都拷贝了,就比较浪费时间和空间。 在这个过程中,拷贝不是立马做的!这叫写时拷贝。(如果父子进程只对数据进行读取,则不需要拷贝)。写时拷贝就是改变了页表与物理地址的映射关系。 这样做,写时拷贝可以节省空间和时间,减少浪费。 数据10M,写入的时候1M,发生写时拷贝,是10M还是1M? 答案是1M,因为操作系统会尽力的节省空间。写多少就拷多少。
fork常规用法
一个父进程希望复制自己,使父子进程同时执行不同的代码段。例如,父进程等待客户端请求,生成子 进程来处理请求。
一个进程要执行一个不同的程序。例如子进程从fork返回后,调用exec函数。
总结:如何理解子进程创建?该如何理解fork? 子进程创建本质是系统多了一个进程,子进程 要以父进程为模板。
fork调用失败的原因
系统中有太多的进程 实际用户的进程数超过了限制
二、进程终止
进程退出场景
代码运行完毕,结果正确 代码运行完毕,结果不正确 代码异常终止
main函数退出的时候,返回的数字叫做进程的退出码! 一般正常进程退出的话都返回0,代表正常退出。 非零代表错误,每个数字都代表一种原因。但发生异常情况的话就没有意义了。
进程常见退出方法
正常终止(可以通过 echo $? 查看进程退出码):
- 从main返回
- 调用exit
- _exit
exit:终止整个进程,任何地方调用都会终止 return:叫做终止函数。mian return,表示进程提出
异常退出: ctrl + c,信号终止
_exit函数
exit函数
exit最后也会调用exit, 但在调用exit之前,还做了其他工作:
- 执行用户通过 atexit或on_exit定义的清理函数。
- 关闭所有打开的流,所有的缓存数据均被写入
- 调用_exit
return退出
return是一种更常见的退出进程方法。执行return n等同于执行exit(n),因为调用main的运行时函数会将main的返回值当做 exit的参数。
三、进程等待
进程等待必要性
之前讲过,子进程退出,父进程如果不管不顾,就可能造成‘僵尸进程’的问题,进而造成内存泄漏。
另外,进程一旦变成僵尸状态,那就刀枪不入,“杀人不眨眼”的kill -9 也无能为力,因为谁也没有办法杀死一个已经死去的进程。
最后,父进程派给子进程的任务完成的如何,我们需要知道。如,子进程运行完成,结果对还是不对,或者是否正常退出。
父进程通过进程等待的方式,回收子进程资源,获取子进程退出信息。
子进程被创建出来,谁先运行,是由调度器说了算的。 那么谁先退出呢?一般而言,我们通常让子进程先退出。
为什么?因为父进程可以很容易对子进程进行管理(垃圾回收)。处理业务,需要让父进程帮我们拿到子进程执行的结果。
一般子进程是需要被等待的,被父进程等,wait/waitpid
进程等待的方法
wait方法 waitpid方法 status :是一个整形指针,其实在传参的时候,该参数是一个输出型参数!
int st = 0; waitpid(pid, &st,0); //开始等待,子进程退出,操作系统就会从进程PCB中读取退出信息,保存在status只想的变量中。
返回之后,st 中就保存的是我们进程退出的信息,int是32bit,是否正常运行,退出吗是多少,退出信号是多少。
如果子进程已经退出,调用wait/waitpid时,wait/waitpid会立即返回,并且释放资源,获得子进程退出信息。
如果在任意时刻调用wait/waitpid,子进程存在且正常运行,则进程可能阻塞。
如果不存在该子进程,则立即出错返回。
获取子进程status
wait和waitpid,都有一个status参数,该参数是一个输出型参数,由操作系统填充。
如果传递NULL,表示不关心子进程的退出状态信息。
否则,操作系统会根据该参数,将子进程的退出信息反馈给父进程。
status不能简单的当作整形来看待,可以当作位图来看待,具体细节如下图(只研究status低16比特 位):
总结wait
是什么?是父进程通过wait等系统调用,用来等待子进程状态的一种现象,必须的 为什么?1。防止进程变成僵尸状态,进而产生内存泄漏2.读取子进程状态 怎么办?wait/waitpid,status(signal,exit code)。
四、进程程序替换
替换原理
fork创建子进程: 1.想让子进程执行父进程代码的一部分(富二代子承父业) 2.想让子进程执行做其他和父进程不同的事情。(自力更生)
用fork创建子进程后执行的是和父进程相同的程序(但有可能执行不同的代码分支),子进程往往要调用一种exec函数以执行另一个程序。当进程调用一种exec函数时,该进程的用户空间代码和数据完全被新程序替换,从新程序的启动例程开始执行。调用exec并不创建新进程,所以调用exec前后该进程的id并未改变。 进程替换后,有没有创建出新的进程? 不算创建了新的进程,因为PCB没有被重新创建,PID没有被重新生成。
替换函数
其实有六种以exec开头的函数,统称exec函数: 这些调用中,第一个参数代表谁要执行谁。
看下面这段代码: 执行的结果为前面一个printf执行而后面的printf不执行。
原因为该函数一旦替换成功,接下来就开始执行ls的代码了,后面的代码就直接被替换了。
exec系列函数,还没有返回值的!!! 如果有返回值的话一定是程序替换错了。
exec系列函数能调用系统程序,能调用自己的程序吗??
可以的。
makefile默认只生成一个可执行程序,默认是自顶向下扫描makefile文件遇到的第一个目标
make bin,默认就生成谁
函数解释
这些函数如果调用成功则加载新的程序从启动代码开始执行,不再返回。
如果调用出错则返回-1
所以exec函数只有出错的返回值而没有成功的返回值。
命名理解
这些函数原型看起来很容易混,但只要掌握了规律就很好记。
l(list) : 表示参数采用列表 v(vector) : 参数用数组 p(path) : 有p自动搜索环境变量PATH e(env) : 表示自己维护环境变量 这里可以总结出规律: 若函数名中有l,则表示参数格式是列表。 若函数名中有p,则表示该函数调用中带路径。 若函数名中有e,则表示当前函数须自己组装环境变量。 只有execve是系统调用,其他的函数都是对它的封装。
一般exel*函数,我们不会自己调用,一般是fork,让子进程调用,父进程只需要wait就行,一旦命令本身有问题,就不会波及父进程。
|