愿我如星君如月,夜夜流光相皎洁。
进程的定义
对于进程的定义,从不同的角度可以有不同的定义,其中较为典型的定义有: (1) 进程是程序的一次执行。 (2) 进程是一个程序及其数据在处理及上顺序执行时所发生的过程。 (3) 进程是具有独立功能的程序在一个数据集合上运行的过程,它是一个实体的运行过程,它是系统进行资源分配的和调度的一个独立单位。
我们平时写的代码经过编译链接之后会形成一个.exe的可执行程序,这个可执行的程序本质上就是一个文件(linux上一切接文件),这个文件是放在我们常说的什么C盘、D盘…等等上的。当我们用鼠标双击并使它开始执行,此时先从输入设备(磁盘)加载数据到内存,之后CPU在从内存中读入数据才开始真正的处理数据,最后CPU将处理好的数据写回内存,最后从内存中写出到输出设备中。 在上面所说的执行过程其满足的是冯诺依曼体系结构。 输入设备:键盘、网卡、磁盘、话筒、摄像头 输出设备:显示器、音响、网卡、磁盘。 为什么要采用这种结构呢? 因为CPU的速度非常快,但是输入输出设备非常慢(相较与内存到CPU),如果输入输出设备直接与CPU进行打交道,此时整体的计算机的效率会因为CPU去等待输入输出设备而被拉慢了,这就是我们常说的木桶原理。 那么为什么内存到CPU就比输入输出设备到CPU快呢?这里不是多一步操作,不应该变的更慢了才对吗? 不能直接从表面去看待问题,虽然多了一个步骤,但不能这么去理解。 由于内存到CPU的速度相较于输入输出设备到CPU的速度较快,并且我们的内存是一个具有装载数据能力的,我们可以先让数据从输入设备预装载到内存中。当我们现在要计算100条数据,此时我们直接把这100条数据预装载到内存中,在让CPU去内存里拿数据,此时整体效率会提升,并且CPU的命中率也会相应的增加。 举个例子: 当你回家去吃饭,你妈妈看到你回来了然后说我先去买菜,买完菜再去洗菜最后在去炒菜,这样时间太久了。最高效的是,你提前和你妈妈说你要回来吃饭了,然后你妈妈提前把菜准备好,回到家就可以直接吃饭了,这样可以大大提高你的效率。 正如我们的CPU此时只需要从内存拿数据计算,计算完成后写回内存即可,而数据的写入和输出由其他设备来完成。 结论:1、正是因为内存具有数据存储能力,并且能预装载数据进而提高效率的秘诀,而数据的预装多少是由OS来决定的。 2、这里的存储器指的是内存,不考虑缓存情况,这里的CPU能且只能对内存进行读写,不能访问外设(输入或输出设备)外设(输入或输出设备) 3、要输入或者输出数据,也只能写入内存或者从内存中读取。 4、一句话,所有设备都只能直接和内存打交道。
进程的创建过程
当我们输入ps aux时,我们可以查看到当前系统中所存在的进程。 而这些进程的创建过程是要经过那些步骤呢? 当我们开机的时候启动的第一个程序就是我们的操作系统,而操作系统是一个用来进行管理驱动、文件、内存、进程管理的一个软件。而进行管理我们就应该想到6字真言,先描述,再组织。 我们先将进程信息描述好被放在一个叫做进程控制块的数据结构PCB(Process Control Block)中,可以理解为进程属性的集合。描述好后OS将新创建的PCB以双向链表的形式将它连接起来。只要OS拿到该双向链表的头指针即可访问完所有的进程。
task_struct
task_struct是Linux内核的一种数据结构,它会被装载到RAM中并且包含着进程的信息。每个进程都把它的信息放在 task_struct 这个数据结构体,task_struct 包含了这些内容: (1)标示符 : 描述本进程的唯一标识符,用来区别其他进程。 (2)状态 :任务状态,退出代码,退出信号等。 (3)优先级 :相对于其他进程的优先级。 (4)程序计数器:程序中即将被执行的下一条指令的地址。 (5)内存指针:包括程序代码和进程相关数据的指针,还有和其他进程共享的内存块的指针。 (6)上下文数据:进程执行时处理器的寄存器中的数据。 (7) I/O状态信息:包括显示的I/O请求,分配给进程的I/O设备和被进程使用的文件列表。 (8) 记账信息:可能包括处理器时间总和,使用的时钟数总和,时间限制,记账号等。
在上面所讲的PCB就是tack_struct的一种,其中上面的标识符为每个进程的pid,而我们可以通过getpid()函数来获取到每个进程的pid。
通过系统调用创建进程
fork()创建子进程
fork()函数创建子进程,并且有两个返回值,父子进程代码共享,数据各自开辟空间,各自私有一份(采用写时拷贝),当子进程修改了变量值,不会影响父进程的变量。 子进程执行从fork函数之后的父进程的代码。 fork函数的返回值: fork函数会返回两个返回值,一个给父进程返回的是子进程的pid,另一个返回0值给子进程。
我们通过fork()函数来创建子进程,并通过if条件判断来进行分流操作。
注意:这里父子进程的调度是由操作系统来调度的,因此不确定谁先被调度。但是有一个能肯定的是,不管谁先被执行完,父进程都会来等待子进程执行完才退出,不然子进程一直是僵尸进程导致资源的浪费。
进程的状态
R—运行状态
如果该进程是R状态并不意味着进程一定在运行中,它表明进程要么是在运行中要么在运行队列里。
S—浅度休眠状态
意味着进程在等待事件完成(这里的睡眠有时候也叫做可中断睡眠)。 我们可以利用如下代码来模拟出一个S状态。 当上面的可执行程序运行后,我们利用 ps aux|head -1&&ps aux |grep myproc.exe|grep -v grep 命令来查看当前进程的状态。 并且在浅度睡眠下,该进程是可以被杀死的。
D—深度睡眠状态
一个进程处于深度睡眠状态,表示尽管OS发现此时内存不够用了该进程不会被杀掉,只有当该进程被唤醒才可以被杀死。有时候也叫不可中断睡眠状态(uninterruptible sleep),在这个状态的进程通常会等待IO的结束。
T—暂停状态
可以通过发送 SIGSTOP 信号给进程来停止(T)进程。这个被暂停的进程可 以通过发送 SIGCONT 信号让进程继续运行。
Z—僵尸状态
子进程先于父进程退出, 子进程在退出的时候会向父进程发送SIGCHLD信号,而父进程收到SIGCHLD信号之后是忽略处理的, 所以是子进程的退出资源没有进程回收, 从而变成了僵尸进程。 僵尸进程的危害:
- 进程的退出状态必须被维持下去,因为他要告诉关心它的进程(父进程),你交给我的任务,我办的怎么样了。就像我们平时写的代码中的返回值一样,返回一个结果给你,然后通过这个结果来看看执行的结果正不正确。当父进程如果一直不读取,那子进程就一直处于Z状态。
- 由于维护退出状态本身就是要用数据维护,也属于进程基本信息,所以保存在task_struct(PCB)中,换句话说,Z状态一直不退出,PCB就会一直都要维护退出状态的信息。
- 当一个父进程创建了很多子进程,子进程都不回收,就会造成内存资源的浪费,因为数据结构对象本身就要占用内存。从而造成内存泄漏。
X—死亡状态 这个状态只是一个返回状态,在任务列表里看不到这个状态。
+状态—前台运行 让前台运行改至后台运行在执行可执行程序后加 & 即可。如果想要杀死该进程使用kill -9 命令。
孤儿进程
孤儿进程:父进程如果提前退出,那么子进程后退出,进入Z状态之后,子进程就称之为“孤儿进程” 孤儿进程,此时子进程被1号init进程领养,最后资源由init(1号)进程回收。 利用如下代码来模拟实现孤儿进程。
进程的优先级
基本概念:就是cpu资源分配给进程的先后顺序,就是指进程的优先权。 优先级越高的进程有优先执行的权力。 ①查看系统进程指令 ps -l,显示结果如下: UID : 代表执行者的身份。 PID : 代表这个进程的代号。 PPID :代表这个进程是由哪个进程发展衍生而来的,亦即父进程的代号。 PRI :代表这个进程可被执行的优先级,其值越小越早被执行 。 NI :代表这个进程的nice值。 其中 PRI 和 NI 与进程的优先级有关 进程的NI(nice)值不是进程的优先级,他们不是一个概念,但是进程nice值会影响到进程的优先级变化。 可以理解nice值是进程优先级的修正修正数据,nice最大与最小修改范围为[-20,19]。 而PRI此时显示的就是进程的优先级,PRI值越小就代表该进程的执行的优先级越高。 linux中优先级=优先级(默认的优先级比如上面的80)+nice值 上面那个默认的优先级不会被改变,所以它的优先级最高是60,最低是99 用top命令更改已存在进程的nice: top 进入top后按“r”–>输入进程PID–>输入nice值
查看进程优先级
[ZJ@VM-0-11-centos 0917]$ ps -al
使用top命令修改进程的优先级
修改进程的优先级 当你输入的nice值,超过[-20,19]时,默认按最大的计算。 I、降低进程优先级 II、升高进程优先级 我们发现升高优先级中,我们一开始的优先级被我们降低至了90,之后我们进行提高。如果你输入的nice值超过了范围,则默认用最大数。 此时我们提高优先级发现并不是我们想要的79,因为在上面我们先降低了了它的优先级,此时在加(-20)那么不应该是60吗? 这里的PRI并不是从你改变的当前值开始改变的。而是从默认老的优先级(80)开始改变。 所以我们得出一个公式: PRI(new)=PRI(old)+nice 注意:当你输入的nice值,超过[-20,19]时,默认按最大的计算。
进程的特征
- 动态性
进程的实质是进程实体的执行过程,因此,动态性就是进程的最基本的特征。动态性还表现在:“它由创建而产生,由调度而执行,由撤销到消亡。”可见,进程实体有一定的生命期,而程序则只是一组有序指令的集合,并存放于某种介质上,其本身不具有活动的含义,因此程序是静态的,而进程是动态的。 - 并发性
是指多个进程实体同存于内存中,且能在一段时间内同时运行。引入进程的目的也正是为了使其进程实体和其他进程实体并发执行。因此,并发性是进程的另一重要特征,同时也成为OS的重要特征。而程序(OS并没有为它创建PCB)是不能参与并发执行的。 - 独立性
独立性是指进程实体是一个能独立运行、独立获得资源和独立接受调度的基本单位。
如果小伙伴还没看懂可以在评论区留言,我会在评论区给你解答! 如有错误之处还请各位指出!!! 那本篇文章就到这里啦,下次再见啦!
|