Linux_进程相关概念
冯诺伊曼体系
我们现在常见的计算机,如笔记本,我们不常见的,如服务器,他们都遵循着冯诺依曼体系
截至到目前为止,我们所认识到的所有计算机,都是由一个个硬件组成
- 输入单元:包括键盘,鼠标,扫描仪,等等.
- 中央处理器(cpu):含有运算器和控制器等
- 输出单元:显示器,打印机等
关于冯诺依曼我们要注意到
操作系统
概念
任何计算机系统都包含一个基本的程序集合,称为操作系统(OS),笼统的理解,操作系统包括:
- 内核(基础管理,内存管理,文件管理,驱动管理)
- 其他程序(例如函数库,shell程序等等)
设计操作系统的目的
首先我们从三个问题入手来了解设计操作系统的目的
1.操作系统是什么
根据上述概念我们得知,OS就是一款针对软硬件资源进行管理工作的软件
2.为什么要有操作系统
操作系统对下:管理好软硬件资源.对上:对于普通用户来说,它为用户提供了良好的运行环境,而对于程序员来说,为期提供了各种基本功能
3.操作系统如何管理
举个例子:假设学校的校长要统计学校的人数,校长不会直接去挨个去数学生的人数,而是会召集各个辅导员让辅导员统计各班的学生最后汇总交给校长
1.管理者和被管理者并不会直接打交道
2.如何管理你呢? 对你做出各种决策,决策是要有依据的(你的属性)
3.管理者与被管理者并不打交道,那么校长是如何知道你的? ->辅导员
? 管理者与被管理者并不打交道–决策的执行者->辅导员
系统调用和库函数的概念
- 在开发角度,操作系统对外会表现为一个整体,但是会暴露自己的部分接口,供上层开发使用,这部分由操作系统的接口,叫做系统调用
- 系统调用在使用上,功能比较基础,对用户的要求也比较高,所以,有心的开发者可以对部分系统调用进行适当的封装,从而形成了库,有了库,就很有利于更上层的用户,或者开发者进行二次开发
进程(重点)
基本概念
- 课本概念:程序的一个执行实例,正在执行的程序等
- 内核观点:担当分配系统资源(cpu时间,内存)的实体
但是上述的观点适用于任何操作系统的进程描述,但也比较片面.
我们先想一个问题,操作系统中可不可能存在大量的进程? 是可以的,那么进程都是由操作系统管理的吗? 当然,是必须的
那么操作系统是如何管理进程的呢? 先描述,再组织
操作系统是如何描述进程?
任何进程在形成的时候,操作系统都要为其创建PCB(进程控制块),OS上面PCB就是一个结构体->struct PCB{//进程的所有属性!}
而在Linux中,PCB->task_struct{//进程的所有属性!}
task_struct->PCB的一种
- 在Linux中描述进程的结构体叫做task_struct。
- task_struct是Linux内核的一种数据结构,它会被装载到RAM(内存)里并且包含着进程的信息。
进程 VS 程序
曾经我们启动的所有程序,本质都是在系统上面创建进程
有了进程控制块,所有的进程管理任务,与进程对应的程序毫无关系!!!与进程对应的内核创建的该进程的PCB强相关!
task_ struct内容分类
- 标示符: 描述本进程的唯一标示符,用来区别其他进程.
- 状态: 任务状态,退出代码,退出信号等。
- 优先级: 相对于其他进程的优先级。
- 程序计数器: 程序中即将被执行的下一条指令的地址.
- 内存指针: 包括程序代码和进程相关数据的指针,还有和其他进程共享的内存块的指针.
- 上下文数据: 进程执行时处理器的寄存器中的数据.
- I/O状态信息: 包括显示的I/O请求,分配给进程的I/O设备和被进程使用的文件列表.
- 记账信息: 可能包括处理器时间总和,使用的时钟数总和,时间限制,记账号等.
- 其他信息
查看进程
1.在Linux中我们如果想查看进程可以通过/proc系统文件查看
比如所:如果想获取PID为1的进程信息,则直接查看/proc/1这个文件夹
2. 还可以通过ps这种用户级工具来获取
#include<iostream>
#include<unistd.h>
using namespace std;
int main()
{
while(1)
{
sleep(1);
}
return 0;
}
我们将这段代码在Linux环境运行起来,然后用ps来获取这段进程的信息
通过系统调用获取进程标示符
通过上图我们可知:
-
进程id(PID) -
父进程(PPID) 操作系统给了们库函数可以去获取当前进程的PID和PPID #include<iostream>
#include<unistd.h>
using namespace std;
int main()
{
cout<<"PID: "<<getpid()<<endl;
cout<<"PPID "<<getppid()<<endl;
while(1)
{
sleep(1);//为了让程序一直运行,便于观察进程信息
}
return 0;
}
通过系统调用创建进程-fork初识
浅谈fork函数
先来看一段代码来了解一下fork
1 #include<iostream>
2 #include<unistd.h>
3 using namespace std;
4 int main()
5 {
6 fork();
7 cout<<"hello proc "<<getpid()<<"hello parent"<<getppid()<<endl;
8 sleep(1);
9 return 0;
10 }
运行后我们发现,明明执行输出语句只有一句,而显示器上却打印了两句,这是上面原因?
其实fork是创建了一个子进程,其返回值有两个,而一般我们调用fork函数之后通常会用if分流
通过上述代码我们知道,fork函数有两个返回值,返回值为0时说明是子进程,当返回值大于0是父进程
如何理解fork创建子进程?
我们创建子进程,就是为了和父进程干一样的事?
如果是干一样的事,那么是没有意义的,我们在上文讲过,一般还是要通过if-else分流来让父子进程来完成不同的工作
fork之后,父子进程谁先运行?
不一定!,还是要取决于调度器,先调度谁,有时父进程先执行,有时,子进程先执行
进程的状态
先看看Linux内核源码怎么说
-
为了弄明白正在运行的进程是什么意思,我们需要知道进程的不同状态。一个进程可以有几个状态(在Linux内核里,进程有时候也叫做任务) -
下面的状态在Kernel源码的定义: /*
* The task state array is a strange "bitmap" of
* reasons to sleep. Thus "running" is zero, and
* you can test for combinations of others with
* simple bit tests.
*/
static const char * const task_state_array[] = {
"R (running)", /* 0 */
"S (sleeping)", /* 1 */
"D (disk sleep)", /* 2 */
"T (stopped)", /* 4 */
"t (tracing stop)", /* 8 */
"X (dead)", /* 16 */
"Z (zombie)", /* 32 */
};
进程的状态信息保在哪里? 毫无疑问依旧在task_struct(PCB)当中
进程状态的意义:方便OS快速判断进程,完成特定的功能,比如调度,本质上是一种分类!
R状态
R状态就是运行状态,但是在这里要注意的是,运行状态它不一定占有有CPU,也千万不要认为,进程只会等待CPU资源!!!
所谓的进程,在运行的时候,有可能会因为运行需要,可以在不同的队列里,在不同的队列里所处的状态时不一样的
S/D状态
S/D状态都可以称之为睡眠状态,只是处于D状态的进程是不可被中断的,在D状态中进程一般会等待IO的结束
x状态
X状态就是死亡状态,这个状态只是一个返回状态,它不会在任务列表里看到这个状态
ps:进程死亡后操作系统会回收进程资源,回收进程资源=进程相关的数据结构+代码和数据
查看进程状态
Z(zombie)-僵尸进程
- 僵尸进程是一个比较特殊的状态.当进程退出且父进程没有读取到子进程退出的返回代码时,就会产生僵尸进程
- 僵尸进程会始终保持在进程表中,并且会一直等待父进程读取退出的进程码
- 所以,只要子进程退出,父进程还在运行,但父进程没有读取到子进程的状态,子进程会进入僵尸状态
举个例子:
僵尸进程的危害
-
进程的退出状态必须被维持下去,因为他要告诉关心它的进程(父进程),你交给我的任务,我办的怎么样了。可父进程如果一直不读取,那子进程就一直处于Z状态?是的! -
维护退出状态本身就是要用数据维护,也属于进程基本信息,所以保存在task_struct(PCB)中,换句话说,Z状态一直不退出,PCB一直都要维护?是的! -
那一个父进程创建了很多子进程,就是不回收,是不是就会造成内存资源的浪费?是的!因为数据结构对象本身就要占用内存,想想C中定义一个结构体变量(对象),是要在内存的某个位置进行开辟空间
孤儿进程
- 父进程先退出,子进程就称之为“孤儿进程
- 孤儿进程被1号init进程领养,当然要有init进程回收喽。
进程优先级
基本概念
-
cpu资源分配的先后顺序,就是指进程的优先权(priority) -
优先权高的进程有优先执行权利。配置进程优先权对多任务环境的linux很有用,可以改善系统性能。 -
还可以把进程运行到指定的CPU上,这样一来,把不重要的进程安排到某个CPU,可以大大改善系统整体性能 为什么会有优先级? 资源太少了! 本质是分配资源的一种方式!
查看优先级
在Linux/Unix中查看优先级一般用ps -l命令则会输出以下几个内容:
我们很容易注意到其中几个重要信息,如下:
- UID:代表执行者身份
- PID:代表这个进程的代号
- PPID:代表这个进程是由哪个进程发展衍生而来的,亦即父进程的代号
- PRI:代表这个进程可被执行的优先级,其值越小越早被执行
- NI:代表这个进程的nice值
PRI and NI
- PRI也还是比较好理解的,即进程的优先级,或者通俗点说就是程序被CPU执行的先后顺序,此值越小进程的优先级别越高
- 那NI呢?就是我们所要说的nice值了,其表示进程可被执行的优先级的修正数值
- PRI值越小越快被执行,那么加入nice值后,将会使得PRI变为:PRI(new)=PRI(old)+nice
- 这样,当nice值为负值的时候,那么该程序将会优先级值将变小,即其优先级会变高,则其越快被执行
- 所以,调整进程优先级,在Linux下,就是调整进程nice值
- nice其取值范围是-20至19,一共40个级别。
PRI VS NI
补充:nice值为什么是一个相对较小的范围呢?
优先级再怎么设置,也只能是一种相对的优先级,不能出现绝对的优先级,否则就会出现很严重的进程“饥饿问题”
并且从调度器的角度出发,调度器要较为均衡的让每个进程享受到CPU资源 =PRI(old)+nice**
- 这样,当nice值为负值的时候,那么该程序将会优先级值将变小,即其优先级会变高,则其越快被执行
- 所以,调整进程优先级,在Linux下,就是调整进程nice值
- nice其取值范围是-20至19,一共40个级别。
PRI VS NI
补充:nice值为什么是一个相对较小的范围呢?
优先级再怎么设置,也只能是一种相对的优先级,不能出现绝对的优先级,否则就会出现很严重的进程“饥饿问题”
并且从调度器的角度出发,调度器要较为均衡的让每个进程享受到CPU资源
|