| |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
-> 大数据 -> MySQL高级-MVCC(超详细整理) -> 正文阅读 |
|
[大数据]MySQL高级-MVCC(超详细整理) |
什么是MVCC?MVCC(multi-version-concurrent-control)
MVCC在MySQL InnoDB中的实现主要是为了提高数据库的并发性能,用更好的方式去处理读-写冲突,做到==即使有读写冲突时,也能做到不加锁,非阻塞并发读==。 什么是当前读和快照读
就像
像不加锁的 之所以出现快照读的情况,是基于提高并发性能的考虑,快照读的实现是基于多版本并发控制(MVCC)。 所以我们可以认为MVCC是行锁的一个变种,但MVCC在很多情况下它避免了加锁,降低了开销,既然是基于多版本的,所以快照读不一定读到的就是最新版本的记录,而是可能为之前的历史版本。 当前读,快照读和MVCC的关系
MVCC能解决什么问题?好处是什么?数据库并发场景?当前假设有三种,分别为:
MVCC带来的好处是?**多版本并发控制(MVCC)**是一种用来解决 读-写 冲突的无所并发控制,也就是为事务分配单向增长的时间戳,为每个修改保存一个版本,版本与事务时间戳关联,也就是每个事务都有一个对应版本的快照,快照版本按照单向增长的时间戳来决定先后顺序。 在这样的情况下,读操作,我们只读该事务开始前的数据库快照,并不去读取正在修改的数据,我们读取事务开始前的最新版本。 所以解决了数据库在并发读取时的问题,即可以做到在读操作时不用阻塞写操作,写操作也不用阻塞读操作,提高了数据库并发读写的性能,同时还可以解决脏读,不可重复读,幻读等事务隔离级别带来的问题。但不能解决更新丢失问题。 小结一下总之,MVCC就是因为大牛们,不满意只让数据库采用悲观锁这些性能不佳的形式去解决读-写冲突问题,而提出的解决方案,所以在数据库中,因为有了MVCC,所以我们可以形成两个组合:
MVCC的实现原理
隐式字段每行记录除了我们自定义的字段外,还有数据库隐式定义的DB_TRXID, DB_ROLL, DB_ROW_ID等字段。
就拿上图来解释这几个字段,DB_ROW_ID 是数据库默认为该行记录生成的唯一隐式主键;DB_TRX_ID 是当前操作该条记录的事务的ID;DB_ROLL_PTR 是一个回滚指针,用于配合 undo日志,指向该条记录的上一个版本;DELETED_FLAG 字段没有展示出来。 UNDO日志InnoDB把这些为了回滚而记录的这些东西称之为 undo log。 值得注意的是,由于查询操作(SELECT)并不会修改任何用户记录,所以在查询操作时,并不需要记录相应的 undo log。 undo log 主要分为以下三种:
对 MVCC 有实质上帮助的是 update undo log,undo log 实际上就是存在于 rollback segment 中的旧纪录链。 说了这么多,云里雾里的,我们来看一个例子:
从上面几个例子可以看出,不同事物或者相同事务对同一个记录的修改,会导致该记录的 undo log 成为一条版本记录链。undo log 的链首就是最新的旧记录,尾部就是最旧的记录(当然,就像之前所说的该 undo log 的节点可能是会被 purge线程 清除掉的,像图中的第一条 insert undo log, 其实在事务提交之后可能就被删除丢失了,不过这里为了演示所以还放在这里,假设没被清除)。 Read View(读视图)
所以我们可以知道 Read View 主要是用来做==可见性判断==的,即当我们某个事物执行快照读的时候,对读取的该记录创建一个 Read View 视图,把它当作条件,用来判断当前事务能够看到哪个版本的数据,既可能是当前最新的数据(也就是该快照),也可能是该行记录的 undo log 日志里的某个版本的数据。 Read View 遵循一个可见性算法: 事务ID查询就不会新增,只有DML语言才会导致事务ID增加。 主要是将被修改的数据的最新记录中的 DB_TRX_ID(当前事务ID)取出来,与系统当前其它活跃事务的ID去对比(由 Read View 维护),如果 DB_TRX_ID 跟 Read View 的属性做了某些比较之后不符合可见性,那就通过 DB_ROLL_PRT 回滚指针去取出 undo log 中的 DB_TRX_ID 再比较,也就是说遍历 undo log 链表的 DB_TRX_ID 找到特定条件的事务ID的版本,那么这个 DB_TRX_ID 所在的旧记录就是当前事务能看见的最新老版本。
如上,他是一段 MySQL 判断可见性的一段源码。即 changes_visible 方法(不完全,但是能看出大致逻辑),该方法展示了我们拿 DB_TRX_ID 去跟 Read View 某些属性进行怎么样的比较。 在介绍前,我们先简化一下 Read View ,我们可以把 Read View 简单的理解成有三个全局属性:
方法大致流程(对比上面代码):
以 Repeatable Read (RR隔离级别)举个例子吧,要求读一个值,一直读都是同一个值:
再举个读已提交的例子:
整体流程说了这么多,我们在了解了 隐式字段、undo log、Read View 的概念之后。就可以来康康 MVCC 的具体实现流程大致是什么样的了。 我们可以模拟一下: 当
ReadView 不仅仅会通过一个列表 trx_list 来维护事务2执行快照读那刻系统中正在活跃的事务ID,还会有两个属性 up_limit_id,low_limit_id;所以在这里的例子中, 我们的例子中,只有事务4修改过该行记录,并在事务2 执行快照读前,就提交了事务。 所以,当前该行数据的 undo log 就如下图所示。 我们的事务2,在快照读该行记录的时候,就会拿该行记录的 DB_TRX_ID 去和 up_limit_id,low_limit_id 和 trx_list(活跃事务ID列表)进行比较,判断当前事务2能看到的记录是哪个版本。 MVCC相关的问题RR是如何再RC级的基础上解决不可重复读的?当前读和快照读在 RR级别 下的区别:
在第二个表中,为什么事务B在事务A的提交后,快照读和当前读都是400呢? 这里与第一个表的唯一区别仅仅是表一的事务A修改金额前快照读过一次金额数据,而表二的事务B在事务A提交前并没进行过快照读。 所以我们知道,事务中快照读的结果非常依赖事务首次出现快照读的地方,即某个事务中首次出现快照读的地方十分的关键,它可以决定该事务后续快照读结果的能力。 我们这里测试的是更新,同时删除和更新也是一样的,如果事务B的快照读是在事务A操作之后进行的,事务B的快照读也是能读取到最新的数据的。 RC,RR级别下的InnoDB快照读有什么不同?正式因为 Read View 的生成时间不同。
反正总而言之就是 RC 隔离级别 下,每个快照读都会生成新的 Read View 以及快照,而在 RR隔离级 别下,则是同一个事务中的第一个快照读才会创建Read View, 之后的快照读获取的都是同一个Read View。 码云仓库同步笔记,可自取欢迎各位star指正:https://gitee.com/noblegasesgoo/notes
|
|
|
上一篇文章 下一篇文章 查看所有文章 |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 | -2024/11/24 11:25:38- |
|
网站联系: qq:121756557 email:121756557@qq.com IT数码 |