缓存行
CPU高速缓存中可以分配的最小存储单位
缓存命中
直接从CPU高速缓存中读取数据
缓存行填充
将内存中的数据copy到CPU高速缓存中
写命中
当处理器将操作数写回到一个内存缓存区域中,会先检查这个缓存的内存地址是否在缓存行中,如果存在一个有效的缓存行,则处理器将这个操作数写回到缓存中,而不是写回到内存
原子操作
不可中断的一个或一系列操作
缓存一致性协议
为了提高处理速度,CPU不会直接与内存通信,而是先将数据从内存读入到高速缓存中(L1,L2,L3)再进行操作,操作完后才写入到内存中。但如果在多处理器下,既使数据写入到了内存中,但是其它的处理器缓存中的值还是旧的,便会引发脏数据问题。此时便需要缓存一致性协议,保证各个处理器的缓存,系统内存是一致的。每个处理器通过嗅探总线上传输的数据来检查自己的缓存是否过期,当发现自己缓存行对应的内存地址被修改,会将处理器的缓存设置为无效状态。Intel 64位处理器上使用的是MESI协议。
可见性
一个线程对共享变量的修改,另一个线程能够立刻看到,称之为可见性
在单核时代,所有的线程都是在一颗CPU上执行,CPU缓存与内存的数据一致性容易解决。所有的线程都是操作同一个CPU的缓存,一个线程对缓存的读写,对另一个线程来说一定是可见的。但是在多核时代,每颗CPU都有自己的缓存,当多个线程在不同的CPU上执行时,这些线程操作的是不同的CPU缓存。
原子性
一个操作是不可中断,即使有多个线程一起执行的时候,一个操作一旦开始,就不会被其它的线程干扰。
以 count +=1 为例。该语句往往有三条CPU指令完成:
- 指令1: 把变量
count 从内存加载到CPU的寄存器 - 指令2: 在寄存器中执行+1操作
- 指令3: 最后将结果写入内存(缓存机制导致写入的是CPU缓存而不是内存)
假设初始状态count=0 ,如果两个线程在执行该语句,线程A在指令1执行完后做线程切换,线程B开始运行,执行指令1, 指令2, 3,将结果1写入内存。然后线程A再执行指令2, 这样最终得到的结果便是2。
乱序执行
编译层面指令重排
在编译期,编译器在不改变单线程程序语义的前提下,可以重新安排语句的执行顺序。如
a = 1; b = 2;
这两行的代码没有任何的依赖关系,在编译时,编译器可能会将其进行重排。
CPU的指令重排
处理器为了提高程序运行效率,可能会对输入代码进行优化,它不保证程序中各个语句的执行先后顺序同代码中的顺序一致,但是它会保证程序最终执行结果和代码顺序执行的结果是一致的。指令重排序不会影响单个线程的执行,但是会影响到线程并发执行的正确性
解决乱序执行的方案
- CPU层面: intel 采用原语(mfence, lfence, sfence) 或者锁总线
- JVM层: 采用内存屏障,内存屏障就是对某部份内存做操作时前后添加屏障,屏障前后的操作不可以乱序执行。
volatile
volatile语义
- 当一个线程修改了一个被volatile修饰的共享变量的值时,新值总是可以被其它的线程立即知道
对于volatile修饰的变量,CPU会将其对应的缓存行数据马上写回系统内存,同时写回内存的操作使其它CPU缓存该内存地址的数据无效。在读一个volatile变量时,JMM会将该线程对应的本地内存置为无效,线程会从主内存中读取数据。
volatile 在JVM中实现: volatile 修饰的变量在写作操前加入StoreStoreBarrier , 写操作后加上StoreLoadBarrier , 在读操作前加上LoadLoadBarrier , 读操作后加上LoadStoreBarrier 。
用volatile实现单例
关于java中单例模式有多种实现方式,其中有一种是DCL(Double Check Lock双重检查锁定)模式, 会涉及到volatile关键词的使用,这里简单列一下
public class Singleton { private volatile static Singleton instance;
private Singleton() {}
public static Singleton getInstance() { if (instance == null) { synchronized (Singleton.class) { if (instance == null) { instance = new Singleton(); } } } return instance; } }
此处之所以要用volatile来修饰是因为instance = new Singleton(); 这一步,其实对于应有三个步骤,分别是
- 分配内存空间
- 初始化对象
- 将内存空间的地址赋给对应的引用
CPU在运行,有可能会发生指令重排,第3步可能在第2步之前运行。假设有两个线程,如果线程A执行到代码instance = new Singleton(); , 如果第3步在第2步之前运行,也就是虽然开辟了内存空间,instance 引用也有了值。但其实对应的对象还没有初始化好,此时如果再调用该对象的某些属性会方法会报错。如果此时线程B进来了,在执行if (instance == null) 语句时,因为instance 不为空,故不会执行下面的代码,直接拿当前的instance ,同样拿到的instance 也是尚未初始化完成的。
单例模式的实现有多种方式,后面会开一篇文章总结一下
final域内存语义
java中用final 来表示属性的不可变。final域的重排序规则如下:
写操作
在构造函数内对一个final域的写入,与随后把这个被构造对象的引用赋值给一个引用变量, 这两个操作之间不能重排序。编译器会在final域的写之后,构造函数的返回之前,插入一个StoreStore屏障。这个屏障禁止处理器把final域的写重排序到构造函数之外
读操作
在一个线程中,初次读对象引用与初次读该对象包含的final域,JMM会禁止重排序这两个操作。编译器会在读final域操作的前面插入一个LoadLoad屏障。初次读对象引用与初次读该对象包含的final域这两个操作之间存在间接依赖的关系,因些编译器不会重排序这两个操作,大多数处理器也会遵间接依赖,不会去重排序。但有少数处理器会有这个操作,这个规则便是针对少数处理器的。
在《Java并发编程的艺术》一书中有这个例子,假设一个线程A执行writer()方法,另一个线程B执行reader()方法。
public class FinalExample { int i ; final int j; static FinalExample obj;
public FinalExample() { i = 1; j = 2; }
public static void writer() { obj = new FinalExample(); }
public static void reader() { FinalExample object = obj; int a = object.i; int b = object.j; } }
在前面有介绍,对于语句obj = new FinalExample(); 其实对应有三个步骤:
- 分配内存空间
- 初始化对象
- 将内存空间的地址赋给对应的引用
CPU在执行时的指令重排,可能会导致第2个步骤在第3个步骤之后执行。对于以上代码就是返回的obj是一个还没有初始化好的对象。虽然构造函数执行了,但是其属性还未初始化完成,所以此时如果有一个线程B来调用其reader 方法,拿到的属性便是错误的数据。而final关键字会禁止CPU的这一行为,保证其初始化在构造函数返回之前执行。
synchronized
synchronized关键字可以作用于普通方法,静态方法, 代码块,运行时会对相应的位子进行加锁。
- 对于普通方法,锁是当前实例, 所以只有同一个实例调用该方法才会互斥
- 对于静态方法,锁是当前类的
Class 对象,类级别的锁。即使在不同的线程中调用不同实例对象,也会有互斥效果 - 对于同步代码块,锁是sychronized括号里配置的对象
普通方法/静态方法
我们定义一个类如下:
package com.fred.javalib.thread;
public class EmptyClass { public synchronized void syncMethod() { }
public synchronized static void syncStaticMethod() { } }
查看其字节码文件
可以发现, 被sychronized修饰的方法在被编译后,其方法的flags属性中会多一个ACC_SYNCHRONIZED 标识。当虚拟机在访问有这个标识的方法时,会在相应的位置添加monitorenter 和monitorexit 指令
同步代码块
对于同步代码块, 是靠monitorenter , monitorexit 指令来实现,我们用javap -verbose Singleton.class 来看一下上面用volatile 关键字实现的单例模式相关代码。
可以看到在上面的字节码中,有一个monitorenter 和 2个monitorexit 。有monitorenter 是去拿锁, 有两个monitorexit 是因为其中一个是代码正常执行结束后释放锁,一个是在代码执行异常时释放锁。
happens-before规则
保证线和可见性的机制,前面一个操作的结果对后续操作是可 见的。
1. 程序的顺序性原则
在一个线程中,按照程序顺序,前面的操作happens-before于后续的任意操作。
2. volatile变量规则
对于一个volatile变量的写操作, happens-before于后续对这个volatile变量的读操作。
3. 传递性
如果A happens-before B,且 B happens-before C,那么 A happens-before C。
在一个线程中,按照程序顺序,前面的操作happens-before于后续的任意操作。
2. volatile变量规则
对于一个volatile变量的写操作, happens-before于后续对这个volatile变量的读操作。
3. 传递性
如果A happens-before B,且 B happens-before C,那么 A happens-before C。
|