创建进程
fork函数初始
在Linux中fork函数是非常重要的函数,它从已经存在的进程中创建一个新进程。新进程为子进程,而原进程为父进程
#include <unistd.h>
pid_t fork(void)
父子进程立场:父进程不需要标识,子进程有需要标识。子进程是要执行任务的,父进程需要区分子进程,子进程不需要 进程调用fork,当控制转移到内核中的fork代码后,内核:
- 分配新的内存块和内核数据结构给子进程
- 将父进程部分数据结构内容拷贝至子进程
- 添加子进程到系统进程列表当中
- fork返回,开始调度器调度
写时拷贝
父子代码共享,父子不再写入时,数据也是共享的,当任意一方试图写入,以写时拷贝的方式各自有一份拷贝 共享是指父子进程对应的页表指向的是同一块物理内存 为何要写时拷贝?
- 进程具有独立性
- 为何不在创建时就分开?-》子进程不一定会使用父进程的所有数据, 写入,需要的时候a、按需分配b、延时分配 ,可以高效使用任何空间
代码90%不会写时拷贝,但是可以写时拷贝(进程替换)
fork常规用法
- 一个父进程希望复制自己,使父子进程执行不同的代码段
- 一个进程要执行一个不同的程序
fork调用失败的原因
进程终止
进程退出场景
(可以通过echo $? 查看最近进程退出码):
- 代码运行完毕,结果正确
- 代码运行完毕,结果不正确
- 代码异常终止(进程崩溃)
#include <stdio.h>
2 int main()
3 {
4 int a = 0;
5 int b = 0;
W> 6 int c = a + b;
7 return 0;
8 }
~
#include <stdio.h>
2 int main()
3 {
4 int a = 0;
5 int b = 0;
W> 6 int c = a + b;
7 return 10;
8 }
进程退出码: 0:只有一种情况 !0:失败有多种原因 每种退出码都有对应的意义,帮助确认失败的原因
#include <stdio.h>
#include <string.h>
int main()
{
int i;
for(i = 0;i<100;i++)
{
printf("%d :%s\n",i,strerror(i));
}
return 10;
}
进程常见退出方法
正常终止
1、从main返回,只有main函数中的return代表退出 2、调用exit :在任何地方调用,都能终止 void exit(int status) status代表退出码 exit会释放进程曾占用的资源 eg:缓冲区 3、_exit 直接终止进程,不会做任何收尾工作
异常退出
- ctrl + c 信号终止
进程异常退出,退出码就没有意义了
_exit 函数
#include <unistd.h>
void _exit(int status);
return退出
return 是一种常见的退出进程的方法,执行return 等同于执行exit(n),因为调用main的运行时函数会将main的返回值当作exit的参数
进程终止时的OS
先将该进程从进程列表及各种调度队列当中将该进程移除,然后释放其相关数据结构,释放内存,清理页表映射关系
进程等待
通常是由父进程完成
进程等待的必要性
- 子进程退出,如果父进程不进行相关处理,就可能会造成僵尸进程的问题,从而造成内存泄漏
- 进程一旦变成僵尸状态,kill -9也不能杀掉
- 父进程派给子进程的任务应该有反馈。父进程通过进程等待的方式,获取进程退出信息
进程的等待方法(由父进程调用)
wait
#include <sys/types.h>
#include <sys/wait.h>
pid_t wait(int* status)
#include <unistd.h>
#include <stdlib.h>
#include <sys/wait.h>
#include <sys/types.h>
int main()
{
int i;
pid_t id = fork();
if(id == 0)
{
int count = 0;
while(count < 5)
{
printf("child:pid :%d,ppid :%d\n",getpid(),getppid());
count++;
sleep(1);
}
}
else{
printf("father:pid :%d,ppid :%d\n",getpid(),getppid());
pid_t ret = wait(NULL);
if(ret >= 0)
{
printf("wait child success!,%d\n",ret);
}
}
return 0;
}
在子进程运行期间,父进程wait的时候,父进程在等子进程退出,这种叫阻塞等待 父子进程谁先运行不确定,但是wait之后,大部分情况都是子进程先退出,父进程读取子进程退出的信息,父进程再退出
waitpid
pid_t wait(pid_t pid,int* status,int options)
pid_t id = fork();
if(id == 0)
{
int count = 0;
while(count < 5)
{
printf("child:pid :%d,ppid :%d\n",getpid(),getppid());
count++;
sleep(1);
}
}
else{
printf("father:pid :%d,ppid :%d\n",getpid(),getppid());
int status = 0;
pid_t ret = waitpid(id,&status,0);
if(ret >= 0)
{
printf("wait child success!,%d\n",ret);
printf("status:%d\n"status);
printf("child exit code :%d\n",(status>>8)&0xFF );
printf("child get signal :%d\n",status&0x7F );
}
}
进程异常时,本质是进程运行的时候出现了某种错误,导致进程收到信号
进程等待成功,意味着子进程退出
int main()
{
int i;
pid_t ids[10];
for(i = 0;i < 10;i++)
{
pid_t id = fork();
if(id == 0)
{
int count = 10;
while(count >0)
{
printf("child:pid :%d,ppid :%d\n",getpid(),getppid()); count--;sleep(1);
}exit(i);
}
ids[i] = id;
}
int count = 0;
while(count < 10)
{
int status = 0;
pid_t ret = waitpid(ids[count],&status,0);
if(WIFEXITED(status))
{
printf("child exit code:%d\n",WEXITSTATUS(status));
}
else{
printf("child not exit normal\n");
}
count++;
}
}
- 如果子进程已经退出,调用wait/waitpid时,wait/waitpid会立即返回,并且释放资源,获得子进程退出信息
- 如果在任意时刻调用wait/waitpid,子进程存在正常运行时,则进程可能阻塞。阻塞:一直等待,什么也不做;非阻塞:也是等,不过不会因为条件不足而“卡住”
- 如果不存在子进程,则立即出错返回
#include <stdio.h>
#include <unistd.h>
#include <sys/types.h>
#include <stdlib.h>
#include <sys/wait.h>
int main()
{
pid_t id = fork();
if(id == 0)
{
int count = 0;
while(count < 10)
{
printf("I am child pid:%d,ppid:%d\n",getpid(),getppid());
sleep(3);
count++;
}
exit(1);
}
while(1)
{
int status = 0;
pid_t ret =waitpid(id,&status,WNOHANG);
if(ret > 0)
{
printf("wait success1\n");
printf("exit code :%d\n",WEXITSTATUS(status));
break;
}
else if(ret == 0)
{
printf("father do other things\n");
sleep(1);
}
else{
printf("waitpid error!\n");
break;
}
}
return 0;
}
进程程序替换
替换原理
用fork创建子进程后执行的是和父进程相同的程序(但有可能执行不同的代码分支),子进程往往要调用一种exec函数以执行另一个程序。当进程调用一种exec函数时,该进程的用户空间代码和数据完全被新程序替换,从新程序启动例程开始执行,调用exec并不创建新进程,所以调用exec前后该进程的id并未改变。 不让子进程访问父进程的资源,把磁盘上某一程序的代码和数据,全部给子进程加载到新的物理内存当中,然后重新建立映射关系。子进程重新从磁盘上加载一个新的程序
替换函数
- int execl(const char* path,const char* arg,…);//…表示可变参数名,以NULL表结束
printf("I am a process\n");
sleep(5);
execl("/usr/bin//ls","ls","-a","-i","-l",NULL);
printf("I am a process\n");
sleep(5);
execl("/usr/bin/top","top",NULL);
printf("hello\n");
execl系列函数,不需要判断返回值,只要返回就是失败
- int execlp(const char* file,const char* arg,…);
execlp("ls","ls","-a","-i","-l",NULL);
- int execle(const char* path,const char* arg,…,char* const envp[]);
- int execv(const char* path,const char* argv[]);
17 char * myargv[] = {
E> 18 "ls",
19 "-a",
20 "-i",
21 "-l",
22 NULL
23 };
24 execv("/usr/bin/ls",myargv);
25 exit(10);
26 }
- int execvp(const char* file,char *const argv[]);
char * myargv[] = {
"ls",
"-a",
"-i",
"-l",
NULL
};
exevp("ls",myargv);
- int execve(const char* file,char *const argv[]);
函数解释
- 函数如果调用成功则加载新的程序,不再返回
- 调用出错返回-1
- exec函数只有出错的返回值,没有成功的返回值
命名理解
- l(list):参数采用列表
- v(vector):参数用数组
- p(path):有p自动搜索环境变量PATH
- e(env):自己维护环境变量
Makefile
.PHONY:all
all:exec cmd
exec:exec.c
gcc -o $@ $^
cmd: mycmd.c
gcc -o $@ $^
.PHONY:clean
clean:
rm -f exec cmd
mycmd
#include <stdio.h>
int main()
{
printf("I am a new exe, mycmd\n");
return 0;
}
exec.c
int main()
{
pid_t id = fork();
if(id == 0)
{
printf("I am a process!\n");
sleep(3);
execl("./cmd","cmd");
exit(10);
}
int status = 0;
pid_t ret = waitpid(id,&status,0);
if(ret > 0)
{
printf("signal:%d\n",status & 0x7F);
printf("exit code:%d\n",(status >> 8) & 0xFF);
}
shell 脚本举例
写脚本:
运行shell脚本 方法一:bash file.sh 方法二:chmod + x file.sh
用C调用脚本
{
pid_t id = fork();
if(id == 0)
{
printf("I am a process!\n");
sleep(3);
execl("./test.sh","test.sh");
exit(10);
}
int status = 0;
pid_t ret = waitpid(id,&status,0);
if(ret > 0)
{
printf("signal:%d\n",status & 0x7F);
printf("exit code:%d\n",(status >> 8) & 0xFF);
}
通过调用程序获取被调用程序导入自定义环境变量
#include <stdio.h>
#include <stdlib.h>
int main()
{
printf("I am a new exe, mycmd\n");
printf("my env:%s\n",getenv("MYENV"));
printf("os env:%s\n",getenv("PATH"));
return 0;
}
{
pid_t id = fork();
if(id == 0)
{
printf("I am a process!\n");
sleep(3);
execl("./mycmd","cmd");
exit(10);
}
int status = 0;
pid_t ret = waitpid(id,&status,0);
if(ret > 0)
{
printf("signal:%d\n",status & 0x7F);
printf("exit code:%d\n",(status >> 8) & 0xFF);
}
所用函数: int execle(const char path,const char* arg,…,char* const envp[]);
pid_t id = fork();
if(id == 0)
{
printf("I am a process!\n");
sleep(3);
char * myargv[] = {
"ls",
"-a",
"-i",
"-l",
NULL
};
char* myenv[]={
"MYENV= you can see me"
};
execle("./cmd","cmd",NULL,myenv);
exit(10);
}
int status = 0;
pid_t ret = waitpid(id,&status,0);
if(ret > 0)
{
printf("signal:%d\n",status & 0x7F);
printf("exit code:%d\n",(status >> 8) & 0xFF);
}
(覆盖式)
模拟实现简易的shell
shell由标识为bash的方块代表,它随着时间流逝向右移动。shell用户读入字符串ls 。shell建立一个新的进程,然后在这个进程中运行ls程序并等待进程结束。 然后shell读取新一行输入,建立一个新的进程,在这个进程中运行程序,并等待这个进程结束
#include <stdio.h>
#include <unistd.h>
#include <stdlib.h>
#include <string.h>
#include <sys/types.h>
#include <sys/wait.h>
#define len 1024
#define num 32
int main()
{
char cmd[len];
char* myarg[num];
while(1)
{
printf("[L@my_centos_mc dir]$");
fgets(cmd,len,stdin);
cmd[strlen(cmd)-1] = '\0';
myarg[0] = strtok(cmd," ");
int i = 1;
while(myarg[i] = strtok(NULL," "))
{
i++;
}
pid_t id = fork();
if(id == 0)
{
execvp(myarg[0],myarg);
exit(10);
}
int status = 0;
pid_t ret = waitpid(id,&status,0);
if(ret > 0)
{
printf("exit code: %d\n",WEXITSTATUS(status));
}
}
return 0;
}
系统启动及用户登录的时候,某些登录软件会自动调用bash程序,将其运行,变成进程
函数和进程之间的相似性
exec/exit就像call/return 一个C程序由很多个函数组成。一个函数可以调用另一个函数,同时传递给它一些参数。被调用的函数执行一定的操作,然后返回一个值,每个函数都有它的局部变量,不同的函数通过call/return 通信。 这种通过参数和返回值在拥有私有数据的函数通信的模式是结构化程序设计的基础。Linux将这种应用程序之内的模式扩展到程序之间
一个C程序可以fork/exec另一个程序,并传给它一些参数。这个被调用的程序执行一定的操作,然后通过exit(n)来返回值。调用它的进程可以通过wait(&ret)来获取exit的返回值
|