MVCC
mvcc : Multi-Version Concurrency Control(多版本并发控制),旨在实现对数据库的并发访问控 制,在编程语言中实现事务内存。
若有人从数据库读数据的同时,有另外的人写入数据,有可能读数据的人看到半写”或者不一致的数 据。有很多方法来解决这个问题,叫做并发控制方法。
最简单的方法就是加锁,让所有的读者等待写者工作完成,但这样会导致效率很低下。MVCC 使用了一种不同的手段,每个连接到数据库的读者,在某个时刻看到的是数据库的一个快照,写者 写操作造成的变化在写操作完成之前(或者数据库事务提交之前)对于其他读者来说是不可见的。
当一个 MVCC 数据库需要更新一条记录的时候,它不会直接用新数据覆盖旧数据,而是将旧数据 标记为过时(obsolete)并在别处增加新版本的数据。这样就会存有多个版本的数据,但是只有一个是最新的。这种多版本的方式避免了填充删除操作在内存和磁盘存储空间结构造成的空洞开销,但是需要系统周期性整理(sweep through),以真实删除老的、过时的数据。
对于面向文档的数据库( Document-oriented Database,即半结构化数据库)来说,这种方式允许系统将整个文档写到磁盘的一块连续区域上 ,当需要更新的时候,直接重写一个版本,而不是对文档的某些比特位、分片切除,或维护一个链式的、非连续的数据库结构。
MVCC提供了时点( point in time)—致性视图。MVCC 并发控制下的读事务一般使用时间戳或者事 务1D 去标记当前读的数据库的状态(版本),读取这个版本的数据。读、写事务相互隔离,不需要 加锁。读写并存的时候,写操作会根据目前数据库的状态,创建一个新的版本,并发的读依旧是访问旧版本的数据。 一句话讲,MVCC 就是用同一份数据临时保留多版本的方式来实现并发控制,也就是一致性视图。
这里留意到 MVCC 关键的两个点:
- 在读写并发的过程中如何实现多版本;
- 在读亏并发后,如何实现旧版本的删除。
|