MVCC-多版本并发控制
读取数据的时候使用一种类似于快照的方式将数据保存下来,通过readview不同的事物只能看到自己对应可见的版本,提高并发性能。
使用条件
mysql数据库隔离级别是以下两个:
- READ COMMITED (读已提交)
- REPEATABLE READ (可重复读)
实现原理
Mysql通过隐藏字段、undo log、readview实现MVCC多版本并发控制。
隐藏字段
InnoDB 存储引擎为每行数据添加了三个 隐藏字段:
- DB_TRX_ID(6字节):表示最后一次插入或更新该行的事务 id。此外,delete 操作在内部被视为更新
- DB_ROLL_PTR(7字节) 回滚指针,指向该行的 undo log 。如果该行未被更新,则为空,查询以前的版本
- DB_ROW_ID(6字节):如果没有设置主键且该表没有唯一非空索引时,InnoDB 会使用该 id 来生成聚簇索引
undo log
mysql三大日志之一,用于记录当前事物对数据做了什么,相当于一个快照,用于回滚操作。另一个作用是 MVCC ,当读取记录时,若该记录被其他事务占用或当前版本对该事务不可见,则可以通过 undo log 读取之前的版本数据,以此实现非锁定读
readview
主要有四个字段
- m_ids:表示在生成readview时,当前系统中活跃的读写事务id列表,就是未提交的事物,如果直接读取会导致脏读。
- min_trx_id:表示在生成readview时,当前系统中活跃的读写事务中最小的事务id,也就是m_ids中最小的值;如果事物id小于当前id号,则可见。
- max_trx_id: 表示生成readview时,系统中应该分配给下一个事务的id值;大于等于该事物id都不可见。
- creator_trx_id:创建该 Read View 的事务id
readview 的两种情况
在不同的隔离级别条件下,readview创建方式也不一样,在READ COMMITED条件下,每次读取操作都会创建新的readview,readview是不断变数的,可能会在读取过程当中有新的数据提交而导致不可重复读。REPEATABLE READ每次会生成一个readview,在该事物过程中不会在重新创建readview,因此不会导致读取到新提交的数据,避免了不可重复度。
过程如下: 总的来说判断就三个条件: undo log的数据中包含的trx_id是否符合min_trx_id和max_trx_id之间 1.1 如果小于min_trx_id说明创建RV 之前 的时候这个trx_id就已经事务提交了,不活跃了,说明可以读。 1.2 如果大于max_trx_id说明这个版本是在创建RV 之后 产生的,不可读。因为创建RV时你这个版本还不存在。 1.3 如果是在这之间的再看步骤2 查看trx_id是否包含m_id之中: 2.1 包含说明创建RV的时候,还是活跃(没提交)事务。那么是不可见的,脏读;继续看步骤3 2.2 不包含说明创建RV之前这个事务已经被提交了,那么是可见的。 到了这里说明这条数据的变更版本在RV之内,则要查看creator_trx_id与trx_id是否一致: 3.1 一致说明就是当前事务创建的;允许使用; 3.2 否则说明是当前RV的其他事务操作的不能使用;
正式在1到2步骤之间,产生的不可重复读问题,如果中间更新了readview,就会读取到新的提交的数据,如果没有更新,就不是读取到,避免了不可重复度。 参考: Mysql隔离级别之MVCC的ReadView的理解 InnoDB存储引擎对MVCC的实现
|