常见进程通信方式
一些理论基础:
-
临界资源:每次仅允许一个进程访问的资源。 -
临界区:每个进程中访问临界资源的那段代码叫临界区
所谓临界区(也称为临界段)就是访问和操作共享数据的代码段。
举个生活的同步例子,你肚子饿了想要吃饭,你叫妈妈早点做菜,妈妈听到后就开始做菜,但是在妈妈没有做完饭之前,你必须阻塞等待,等妈妈做完饭后,自然会通知你,接着你吃饭的事情就可以进行了。
注意,同步与互斥是两种不同的概念:
同步就好比:「操作 A 应在操作 B 之前执行」,「操作 C 必须在操作 A 和操作 B 都完成之后才能执行」等; 互斥就好比:「操作 A 和操作 B 不能在同一时刻执行」;
system V 信号量
信号量用途:主要用于多进程或多线程对公共资源 对象的访问控制。 用来解决多进程(多线程同步的问题),类似于一把锁,访问前获取锁(获取不到则等待),访问后释放锁。
多进程/多线程一般是并发执行,如果对公共资源访问没有做同步处理,很容易造成数据破坏
信号量其实是一个整型的计数器,主要用于实现进程间的互斥与同步,而不是用于缓存进程间通信的数据 。
信号量表示资源的数量,控制信号量的方式有两种原子操作:
一个是 P 操作,这个操作会把信号量减去 -1,相减后如果信号量 < 0,则表明资源已被占用,进程需阻塞等待;相减后如果信号量 >= 0,则表明还有资源可使用,进程可正常继续执行。 另一个是 V 操作,这个操作会把信号量加上 1,相加后如果信号量 <= 0,则表明当前有阻塞中的进程,于是会将该进程唤醒运行;相加后如果信号量 > 0,则表明当前没有阻塞中的进程;
P 操作是用在进入共享资源之前,V 操作是用在离开共享资源之后,这两个操作是必须成对出现的。
举个类比,2 个资源的信号量,相当于 2 条火车轨道,PV 操作如下图过程:
一辆火车进入轨道,相当于信号量的P操作,资源-1,这样就剩下一条轨道
接着又一辆火车占用另一条轨道,也就是P操作,资源-1
此时交通信号灯变为红色,因为没有轨道可用,第三辆火车必须等待
第一辆火车离开轨道,相当于V操作,此时轨道资源为1,交通灯变为绿灯 第三辆火车发现交通信号灯变绿,于是进入火车轨道,轨道资源耗尽为0,于是交通信号灯变为红灯
在这个火车轨道系统中,轨道是公共资源,每辆火车好比一个线程,交通信号灯起的就是信号量的作用。信号量可以实现锁的互斥操作,也可以实现进程/线程同步
信号量类型
1)二进制信号量(也叫二值信号量) 此时信号量的初值只能是0和1。(二进制信号量可以实现互斥锁操作)
2)一般/计数信号量 此时信号量的初值可以是任意非负数。显然,其包含二进制信号量。上面举的火车轨道例子就可以使用计数信号量来实现,一般计数信号量与锁的区别是它可以允许多个线程/进程(线程的数量由计数信号量初值定义) 同时操作公共资源
一般只有在开发多进程的时候才可能遇到需要使用信号量的场景,phper 几乎很少有使用信号量的场景,就算有多进程对公共资源操作,大多也是使用 flock 文件锁做互斥操作
php模拟多进程操作公共资源
<?php
$file = "num.txt";
$count =0;
file_put_contents($file,$count);
$pid = pcntl_fork();
if($pid == 0){
$x = (int)file_get_contents($file);
for($i=0; $i<1000; $i++){
$x = $x + 1;
}
file_put_contents($file,$x);
exit(0);
}
$x = (int)file_get_contents($file);
for($i=0; $i<1000; $i++){
$x = $x+1;
}
file_put_contents($file,$x);
在编写一个shell 脚本辅助
#!/bin/bash
for a in {1..1000}
do
(php demo1.php)
b=`cat num.txt`
if [ $b != 2000 ]
then
echo -e "错误$b"
fi
done
按理来说,变量 $x 最后写入文件的值应该是2000,但很不幸,并不是如此,我们对上面的脚本执行一下: 运行了1000次,发现出现了变量$x值结果是 1000 的有8次,虽然发生错误的概率比较小,但是在计算机里是不能容忍的。
为什么会出现这种情况,我们知道单核cpu系统里为了实现多个程序同时运行的假象,操作系统通常都采用时间片调度,一个进程时间片用完就切换下一个进程运行,加上我们的高级语言不是每一行代码都是原子性的,比如x = (int)file_get_contents( $file) 这行代码对于我们来说是不可分割是原子性的,但是经过编译器编译成汇编码【机器指令】可能是多条指令实现,这样就会出现问题,如果指令只执行到一半进程分配的时间片用完或者被其他进程打断,都有可能造成数据损坏,导致最后计算结果出现误差
使用 php 封装system v 信号量集 函数
<?php
$file = "num.txt";
$count =0;
$key = ftok("demo1.php","x");
$sem_id = sem_get($key,1);
file_put_contents($file,$count);
$pid = pcntl_fork();
if($pid == 0){
sem_acquire($sem_id);
$x = (int)file_get_contents($file);
for($i=0; $i<1000; $i++){
$x = $x + 1;
}
file_put_contents($file,$x);
sem_release($sem_id);
exit(0);
}
sem_acquire($sem_id);
$x = (int)file_get_contents($file);
for($i=0; $i<1000; $i++){
$x = $x+1;
}
file_put_contents($file,$x);
sem_release($sem_id);
加入信号量后,那就一定保证100%是2000,绝对不会出现其他数值。
|