copy-on-write 译义是写时复制,简称cow。常见中并发编程中,如jdk中并发工具包CopyOnWriteArrayList,CopyOnWriteSet 等就使用的该技术保证并发访问效率。
使用场景:
适合读多写少的场景。 我们知道读写锁也适合读多写少的场景,但与cow使用的完全不同实现技术,而且他们有个本质的区别是cow读写不互斥 而读写锁读写互斥。
实现思想:
多个线程对同一个资源进行访问时,一般读取操作不会有并发安全性问题,直到有一个线程进行对资源修改操作,那么先对资源复制一份,然后在副本上进行修改,修改完成之后替换原来的资源。
技术实现原理:
cow在不同的技术领域可能实现方式不同,java,redis持久化,甚至liunx操作系统实现原理都不同,主要在数据复制过程不同,有的是惰性复制,有的是实时复制等。
Java 中的 copy-on-write
CopyOnWriteArrayList 的部分源码
private transient volatile Object[] array;
public boolean add(E e) {
final ReentrantLock lock = this.lock;
lock.lock();
try {
Object[] elements = getArray();
int len = elements.length;
Object[] newElements = Arrays.copyOf(elements, len + 1);
newElements[len] = e;
setArray(newElements);
return true;
} finally {
lock.unlock();
}
}
底层使用数组保存数据,add方法使用lock保证线程安全,不然会出现多个副本,使用 Arrays.copyOf 方法复制出一份新数据然后添加数据,最后把新的引用赋值给array, 要使用 volatile保证array的引用可见,不然读的线程可能还是拿的旧的array引用,这样就可能会有问题。
redis 中的 copy-on-write
redis的rdb持久化使用的因为时 cow技术,redis在做rdb持久化时内部启动一个新的子进程做持久化任务,该共享主进程内存数据,主进程这时还是可以响应客户端的请求,当主进程接收到写操作时候会先将数据复制一份出来,然后在副本上进行修改,等持久化任务完成之后再覆盖内存地址的引用。 其实redis在对aof进行文件压缩时也是使用的cow操作。
liunx 中的 copy-on-write
我这里只是总结下 ,详细可以参考大神 https://www.cmsblogs.com/group/1420041599311810560
|