IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 系统运维 -> 操作系统之进程创建与进程状态 -> 正文阅读

[系统运维]操作系统之进程创建与进程状态

一、进程的创建

阻塞状态:正在运行的进程由于某些原因调用阻塞原语把自己阻塞(如果不把自己阻塞的话会一直占用处理机),等待相应的事件出现后才被唤醒,事件完成回到就绪状态。
通常这种处于阻塞状态的进程也排成一个队列。有的系统则根据阻塞原因的不同而处于阻塞状态进程排成多个队列。挂起状态是被迫被外界挂起,阻塞是正常流程中的一部分,是自愿阻塞。

系统中同时运行着很多进程,这些进程都是从一个进程开始一个一个复制出来的。进程通过fork系列的系统调用(fork、clone、vfork)来创建,内核(或内核模块)也可以通过kernel_thread函数创建内核进程。这些创建子进程的函数本质上都完成了相同的功能——将调用进程复制一份,得到子进程。(可以通过选项参数来决定各种资源是共享、还是私有)fork的作用是根据一个现有的进程复制出一个新进程,原来的进程称为父进程(Parent Process),新进程称为子进程(ChildProcess)。一个进程调用fork()函数后,系统先给新的进程分配资源,例如存储数据和代码的空间。然后把原来的进程的所有值都复制到新的新进程中,只有少数值与原来的进程的值不同。相当于克隆了一个自己。

#include <unistd.h>
pid_t fork(void);

子进程复制父进程的0到3g空间和父进程内核中的PCB,但id号不同。fork调用一次返回两次:父进程中返回子进程ID,子进程中返回0。读时共享,写时复制。在Shell下输入命令可以运行一个程序是因为Shell进程在读取用户输入的命令之后会调用fork复制出一个新的Shell进程,然后新的Shell进程调用exec执行新的程序。父进程读取命令,子进程执行命令。父进程在调用fork创建子进程时会把自己的环境变量表也复制给子进程。

fork(写时复制):父进程调用fork()后
在虚拟地址空间 子进程会复制父进程的代码段 数据段 ?内核中的pcb文件描述度表也会复制但是其中的进程id不同。在物理存储空间 子进程和父进程会先共享父进程的物理空间 等到父子进程中出现对物理空间的修改时,再为子进程相应的段分配物理空间。
比如子进程执行exec就是对物理空间进行修改 这个时候再去为子进程创建物理空间。fork以后严格意义上说父子进程调度顺序是不确定的 但是一般是先执行子进程 因为假设父进程对物理空间做了变动,然后按照上面所说要为子进程分配物理空间 然后子进程执行exec ?还是要覆盖掉刚刚赋值的内容。vfork在写时复制的基础上进行改进,子进程连虚拟地址空间也不复制了 也共享父进程的。

fork出错可能有两种原因:
????1)当前的进程数已经达到了系统规定的上限,这时errno的值被设置为EAGAIN。
????2)系统内存不足,这时errno的值被设置为ENOMEM。
????创建新进程成功后,系统中出现两个基本完全相同的进程,这两个进程执行没有固定的先后顺序,哪个进程先执行要看系统的进程调度策略。

fork()与vfock()都是创建一个进程,有以下区别:?
1.??fork():子进程拷贝父进程的数据段,代码段,vfork ():子进程与父进程共享数据段?
2.??fork()父子进程的执行次序不确定?
????vfork 保证子进程先运行,在调用exec 或exit 之前与父进程数据是共享的,在它调用exec或exit 之后父进程才可能被调度运行。?如果在调用这两个函数之前子进程依赖于父进程的进一步动作,则会导致死锁。?
子进程拷贝父进程的代码段的例子:?

1.?#include<sys/types.h>
2.?#include<unistd.h>
3.?#include<stdio.h>
4.??
5.?int?main()
6.?{
7.?????pid_t?pid;
8.?????pid = fork();
9.?????if(pid<0)
10.?????????printf("error in fork!\n");
11.?????else?if(pid == 0)
12.?????????printf("I am the child process,ID is %d\n",getpid());
13.?????else?
14.?????????printf("I am the parent process,ID is %d\n",getpid());
15.?????return?0;
16.??
17.?}
1.?[root@localhost fork]# gcc -o fork fork.c
2.?[root@localhost fork]# ./fork
1.?I am the child process,ID is 4711
2.?I am the parent process,ID is 4710

fork()函数用于从已存在的进程中创建一个新的进程,返回值有两个,子进程返回0,父进程返回子进程的进程号,进程号都是非零的正整数,所以父进程返回的值一定大于零。在pid=fork();之后,父进程和新创建的子进程都在运行,所以如果pid==0,那么肯定是子进程,若pid !=0(事实上大于0),那么是父进程在运行。而fork()函数子进程是拷贝父进程的代码段的,所以子进程中同样有
if(pid<0)?
?????????printf("error in fork!");?
?????else if(pid==0)?
?????????printf("I am the child process,ID is %d\n",getpid());?
?????else?
?????????printf("I am the parent process,ID is %d\n",getpid());?
这么一段代码,所以上面这段代码会被父进程和子进程各执行一次,最终由于子进程的pid==0,
而打印出第一句话,父进程的pid>0,而打印出第二句话。于是得到了上面的运行结果。?
看一个拷贝数据段的例子:?

1.?#include<sys/types.h>
2.?#include<unistd.h>
3.?#include<stdio.h>
4.??
5.?int?main()
6.?{
7.?????pid_t?pid;
8.?????int?cnt = 0;
9.?????pid = fork();
10.?????if(pid<0)
11.?????????printf("error in fork!\n");
12.?????else?if(pid == 0)
13.?????{
14.?????????cnt++;
15.?????????printf("cnt=%d\n",cnt);
16.?????????printf("I am the child process,ID is %d\n",getpid());
17.?????}
18.?????else
19.?????{
20.?????????cnt++;
21.?????????printf("cnt=%d\n",cnt);
22.?????????printf("I am the parent process,ID is %d\n",getpid());
23.?????}
24.?????return?0;
25.?}
1.?[root@localhost fork]# ./fork2
2.?cnt=1
3.?I am the child process,ID is 5077
4.?cnt=1
5.?I am the parent process,ID is 5076

?为什么不是2 ?因为fork?()函数子进程拷贝父进程的数据段代码段,所以?
cnt++;?
????printf("cnt= %d\n",cnt);
????return 0?
将被父子进程各执行一次,但是子进程执行时使自己的数据段里面的(这个数据段是从父进程那copy 过来的一模一样)count+1,同样父进程执行时使自己的数据段里面的count+1,?他们互不影响,便出现了如上的结果。

如果将上面程序中的fork ()改成vfork():
1.?[root@localhost fork]# gcc -o fork3 fork3.c
2.?[root@localhost fork]# ./fork3
3.?cnt=1
4.?I am the child process,ID is 4711
5.?cnt=1
6.?I am the parent process,ID is 4710
7.?段错误
?
vfock()是共享数据段的,?vfork 和fork 之间的另一个区别是:vfork 保证子进程先运行,在调用exec 或exit 之后父进程才可能被调度运行。如果在调用这两个函数之前子进程依赖于父进程的进一步动作,则会导致死锁。?上面程序中的fork ()改成vfork()后,vfork()创建子进程并没有调用exec或exit,所以最终将导致死锁。?怎么改呢:?

1.?#include<sys/types.h>
2.?#include<unistd.h>
3.?#include<stdio.h>
4.??
5.?int?main()
6.?{
7.?????pid_t?pid;
8.?????int?cnt = 0;
9.?????pid = vfork();
10.?????if(pid<0)
11.?????????printf("error in fork!\n");
12.?????else?if(pid == 0)
13.?????{
14.?????????cnt++;
15.?????????printf("cnt=%d\n",cnt);
16.?????????printf("I am the child process,ID is %d\n",getpid());
17.???????? _exit(0);
18.?????}
19.?????else
20.?????{
21.?????????cnt++;
22.?????????printf("cnt=%d\n",cnt);
23.?????????printf("I am the parent process,ID is %d\n",getpid());
24.?????}
25.?????return?0;
26.??
27.?}
1.?[root@localhost fork]# gcc -o fork3 fork3.c
2.?[root@localhost fork]# ./fork3
3.?cnt=1
4.?I am the child process,ID is 4711
5.?cnt=2
6.?I am the parent process,ID is 4710

如果没有_exit(0)的话,子进程没有调用exec 或exit,所以父进程是不可能执行的,在子进程调用exec 或exit 之后父进程才可能被调度运行。?所以加上_exit(0);使得子进程退出,父进程执行,这样else 后的语句就会被父进程执行,?又因在子进程调用exec 或exit之前与父进程数据是共享的,所以子进程退出后把父进程的数?据段count改成1 了,子进程退出后,父进程又执行,最终就将count变成了2。?
为什么会有vfork,因为以前的fork 创建一个子进程时,将会创建一个新的地址空间,并且拷贝父进程的资源,而往往在子进程中会执行exec 调用,这样前面的拷贝工作就白费力气了。这种情况下就想出了vfork,它产生的子进程刚开始暂时与父进程共享地址空间(其实就是线程的概念了)。因为这时候子进程在父进程的地址空间中运行,所以子进程不能进行写操作,并且在儿子霸占着老子的房子时候,要委屈老子在外面歇着(阻塞)。一旦儿子执行了exec 或者exit 后,相于儿子买了自己的房子,这时候就相于分家了。

写时复制是有一块内存,由多个进程共享,属性是只读的,当有一个进程对这块内存进行写的时候,系统会先申请一块新的内存给他写。比如进程fork的时候,父子进程对应的物理地址都一样,这时候会在页表项中记录该物理地址是只读的,有一个进程写的时候,就会触发写保护异常。执行写时复制。

二、进程状态

1.运行态

运行态的进程可以分为3种情况:内核运行态、用户运行态、就绪态。只有在该状态的进程才可能在CPU上运行。而同一时刻可能有多个进程处于可执行状态,这些进程的task_struct结构(进程控制块)被放入对应CPU的可执行队列中(一个进程最多只能出现在一个CPU的可执行队列中)。进程调度器的任务就是从各个CPU的可执行队列中分别选择一个进程在该CPU上运行。

正在CPU上执行的进程定义为RUNNING状态、可执行但是尚未被调度执行的进程定义为READY状态,这两种状态在linux下统一为 TASK_RUNNING状态。Linux 中把所有处于运行、就绪状态的进程链接成一个双向链表,称为可运行队列(run_queue)。使用任务结构体中的两个指针:
Struct task_struct *next_run;/*指向后一个任务结构体的指针*/
Struct task_struct *prev_run;/*指向前一个任务结构体的指针*/
该链表的首结点为 init_task。系统设置全局变量 nr_running 记录处于运行、就绪态的进程数。

用fork创建子进程后执行的是和父进程相同的程序(但有可能执行不同的代码分支),子进程往往要调用一种exec函数以执行另一个程序。当进程调用一种exec函数时,该进程的用户空间代码和数据完全被新程序替换,从新程序的启动例程开始执行。调用exec并不创建新进程,所以调用exec前后该进程的id并未改变。

2.睡眠与暂停状态

(TASK_INTERRUPTIBLE)可中断的睡眠状态

当进程调用一个阻塞的系统函数时,该进程被置于睡眠(Sleep)状态,这时内核调度其它进程运行,直到该进程等待的事件发生了(比如网络上接收到数据包,或者调用sleep指定的睡眠时间到了)它才继续运行。处于这个状态的进程因为等待某事件的发生(比如等待socket连接、信号量)而被挂起。这些进程的task_struct结构被放入对应事件的等待队列中。当这些事件发生时(由外部中断触发、或由其他进程触发),对应的等待队列中的一个或多个进程将被唤醒。

一般情况下,进程列表中的绝大多数进程都处于TASK_INTERRUPTIBLE状态(除非机器的负载很高)。毕竟CPU就这么一两个,进程动辄几十上百个,如果不是绝大多数进程都在睡眠,CPU又怎么响应得过来。


(TASK_UNINTERRUPTIBLE)不可中断的睡眠状态

不可中断,指的不是CPU不响应外部硬件的中断,而是指进程不响应异步信号。绝大多数情况下,进程处在睡眠状态时,总是应该能够响应异步信号的。否则发现,kill -9竟然杀不死一个正在睡眠的进程了.
TASK_UNINTERRUPTIBLE状态存在的意义在于,内核的某些处理流程是不能被打断的。如果响应异步信号,程序的执行流程中就会被插入一段用于处理异步信号的流程(这个插入的流程可能只存在于内核态,也可能延伸到用户态),于是原有的流程就被中断了。
? ? ? ?在进程对某些硬件进行操作时(比如进程调用read系统调用对某个设备文件进行读操作,而read系统调用最终执行到对应设备驱动的代码,并与对应的物理设备进行交互),可能需要使用TASK_UNINTERRUPTIBLE状态对进程进行保护,以避免进程与设备交互的过程被打断,造成设备陷入不可控的状态。这种情况下的TASK_UNINTERRUPTIBLE状态总是非常短暂的,通过ps命令基本上不可能捕捉到。
? ? ?linux系统中也存在容易捕捉的TASK_UNINTERRUPTIBLE状态。执行vfork系统调用后,父进程将进入TASK_UNINTERRUPTIBLE状态,直到子进程调用exit或exec。通过下面的代码就能得到处于TASK_UNINTERRUPTIBLE状态的进程:#include ? void main() { ?if (!vfork()) sleep(100); ?}?

(TASK_STOPPED or TASK_TRACED)暂停状态或跟踪状态
?? ? ? ?向进程发送一个SIGSTOP信号,它就会因响应该信号而进入TASK_STOPPED状态(除非该进程本身处于TASK_UNINTERRUPTIBLE状态而不响应信号)。(SIGSTOP与SIGKILL信号一样,是强制的,不允许用户进程通过signal系列的系统调用重新设置对应的信号处理函数)向进程发送一个SIGCONT信号,可以让其从TASK_STOPPED状态恢复到TASK_RUNNING状态。

当进程正在被跟踪时,它处于TASK_TRACED这个特殊的状态。“正在被跟踪”指的是进程暂停下来,等待跟踪它的进程对它进行操作。比如在gdb中对被跟踪的进程下一个断点,进程在断点处停下来的时候就处于TASK_TRACED状态。而在其他时候,被跟踪的进程还是处于前面提到的那些状态。

对于进程本身来说,TASK_STOPPED和TASK_TRACED状态很类似,都是表示进程暂停下来。而TASK_TRACED状态相当于在TASK_STOPPED之上多了一层保护,处于TASK_TRACED状态的进程不能响应SIGCONT信号而被唤醒。只能等到调试进程通过ptrace系统调用执行PTRACE_CONT、PTRACE_DETACH等操作(通过ptrace系统调用的参数指定操作),或调试进程退出,被调试的进程才能恢复TASK_RUNNING状态。

3.退出状态

一个进程在执行系统调用exit函数结束自己的生命的时候,并没有真正的被销毁, 而是留下一个称为僵尸进程(Zombie)的数据结构(系统调用exit,它的作用是使进程退出,但也仅仅限于将一个正常的进程变成一个僵尸进程,并不能将其完全销毁)。在这个退出过程中,进程占有的所有资源,除了task_struct结构(以及少数资源)以外将被回收。于是只剩下task_struct这么个空壳,故称为僵尸。
保留task_struct是因为task_struct里面保存了进程的退出码以及一些统计信息。其父进程很可能会关心这些信息。比如在shell中,$?变量就保存了最后一个退出的前台进程的退出码,而这个退出码往往被作为if语句的判断条件。内核也可以将这些信息保存在别的地方,而将task_struct结构释放掉,以节省一些空间。但是使用task_struct结构更为方便,因为在内核中已经建立了从pid到task_struct查找关系,还有进程间的父子关系。释放掉task_struct,则需要建立一些新的数据结构,以便让父进程找到它的子进程的退出信息。

在子进程中调用exit/return 可以终结子进程,但是这种终结不是销毁 ,子进程此时变成僵尸态。如果父进程一直没有去主动获取子进程的结束状态值,那么子进程就一直保持僵尸状态。通过wait/waitpid函数就可以获取退出状态值从而回收僵尸进程。一个进程在终止时会关闭所有文件描述符,释放在用户空间分配的内存,但它的PCB还保留着,内核在其中保存了一些信息:如果是正常终止则保存着退出状态,如果是异常终止则保存着导致该进程终止的信号是哪个。这个进程的父进程可以调用wait或waitpid获取这些信息,然后清除掉这个进程。一个进程的退出状态可以在Shell中用特殊变量$?查看,因为Shell是它的父进程,当它终止时Shell调用wait或waitpid得到它的退出状态同时彻底清除掉这个进程。如果一个进程已经终止,但是它的父进程尚未调用wait或waitpid对它进行清理,这时的进程状态称为僵尸(Zombie)进程。任何进程在刚终止时都是僵尸进程。

销毁僵尸进程

父进程可以通过wait系列的系统调用(如wait、waitpid)来等待某个或某些子进程的退出,并获取它的退出信息。然后wait系列的系统调用会顺便将子进程的尸体(task_struct)也释放掉。父进程通过wait和waitpid等函数等待子进程结束,这会导致父进程挂起,相关用法可以通过man命令查看。

子进程在退出的过程中,内核会给其父进程发送一个信号,通知父进程来“收尸”。这个信号默认是SIGCHLD,但是在通过clone系统调用创建子进程时,可以设置这个信号。可以用signal函数为SIGCHLD安装handler回调函数,子进程结束后父进程会收到该信号,可以在handler中调用wait回收。

如果父进程不关心子进程什么时候结束,那么可以用signal(SIGCHLD,SIG_IGN) 通知内核,自己对子进程的结束不感兴趣,那么子进程结束后内核会回收, 并不再给父进程发送信号。fork两次,父进程fork一个子进程,然后继续工作,子进程fork一 个孙进程后退出,那么孙进程被init接管,孙进程结束后init会回收。不过子进程的回收还要自己做。

僵尸进程和孤儿进程区别
僵尸进程: 一个进程使用fork创建子进程,如果子进程退出,而父进程没有调用wait或者waitpid获取子进程的状态,那么子进程的进程描述符仍然保存在系统中,这种进程称为僵尸进程。
孤儿进程: 父进程先于子进程结束,则子进程成为孤儿进程,子进程的父进程成为1号进程init进程,称为init进程领养孤儿进程。子进程的死亡需要父进程来处理,当父进程先于子进程死亡时,子进程死亡没有父进程处理,这个死亡的子进程就是孤儿进程。
僵尸进程占用一个进程ID号,占用资源,危害系统。孤儿进程与僵尸进程不同的是,由于父进程已经死亡,子系统会帮助父进程回收处理孤儿进程。所以孤儿进程实际上是不占用资源的,因为它最终是被系统回收了,不会像僵尸进程那样占用ID。

exit对_exit进行了一些包装,使得整个退出的过程显得不那么粗暴,共同点就是都会关闭文件描述符,都会清空内存,但是exit还会额外地清空输入输出流缓存,移除临时创建的文件,调用注册好的出口函数等等。

wait()函数功能是:父进程一旦调用了wait就立即阻塞自己,由wait自动分析是否当前进程的某个子进程已经退出,如果让它找到了这样一个已经变成僵尸的子进程,wait就会收集这个子进程的信息,并把它彻底销毁后返回;如果没有找到这样一个子进程,wait就会一直阻塞在这里,直到有一个出现为止。

4.(TASK_DEAD - EXIT_DEAD),退出状态,进程即将被完全销毁?

进程在退出过程中也可能不会保留它的task_struct。比如这个进程是多线程程序中被detach过的进程。或者父进程通过设置SIGCHLD信号的handler为SIG_IGN,显式的忽略了SIGCHLD信号。(这是posix的规定,尽管子进程的退出信号可以被设置为SIGCHLD以外的其他信号)此时进程将被置于EXIT_DEAD退出状态,这意味着接下来的代码立即就会将该进程彻底释放。所以EXIT_DEAD状态是非常短暂的,几乎不可能通过ps命令捕捉到。

  系统运维 最新文章
配置小型公司网络WLAN基本业务(AC通过三层
如何在交付运维过程中建立风险底线意识,提
快速传输大文件,怎么通过网络传大文件给对
从游戏服务端角度分析移动同步(状态同步)
MySQL使用MyCat实现分库分表
如何用DWDM射频光纤技术实现200公里外的站点
国内顺畅下载k8s.gcr.io的镜像
自动化测试appium
ctfshow ssrf
Linux操作系统学习之实用指令(Centos7/8均
上一篇文章      下一篇文章      查看所有文章
加:2021-11-20 18:49:01  更:2021-11-20 18:49:53 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年12日历 -2024/12/27 5:16:58-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码
数据统计