IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 大数据 -> InnoDB MVCC原理 -> 正文阅读

[大数据]InnoDB MVCC原理

MySQL系列

第一章:sql_mode模式
第二章:optimize table、analyze table、alter table、gh-ost
第三章:InnoDB MVCC原理


一、隔离性与隔离级别

在平时的开发工作中,经常使用MySQL InnoDB的事务特性ACID(Atomicity、Consistency、Isolation、Durability,即原子性、一致性、隔离性、持久性),隔离性性就是其中的I。当多个事务同时执行的时候,就会出现脏读、不可重复读、幻读问题。而隔离性就是为了解决这些问题。当然任何技术都是没有银弹的,都正反两个方面,隔离性也不例外,隔离性越高,并发能力越低。
InnoDB目前支持DB标准中的四个隔离级别,如下所示:

  • 读未提交(read uncommited)
    一个事务还没有提交,它的变更可以被其他事务查看到。
  • 读提交(read committed)
    事务提交后,它的变更后才能被其他事务查看到。
  • 可重复读(repeatable read)
    事务执行过程中,看到的数据和事务启动时看到的事务保持一致,也就是说该事务执行过程中的事务变更的数据不可见。
  • 串行化(serializable )
    数据的读锁,写锁,会出现冲突,必须等到前一个锁执行完才能执行。我们熟知的Redis就是使用单线程来执行命令,也就是串行化保证数据的隔离性。

二、MVCC原理

MVCC主要用在读提交、可重复读中,而MySQL的默认隔离级别就是可重复读。MVCC原理使用行记录的隐藏队列,先熟悉一下:

1.行记录隐藏列

  • row_id
    行ID,6字节,记录的唯一标识;当用户在表中定义了主键字段就优先选择用户定义的主键,如果没有,就查找是否有定义不为null的唯一索引,如果有就把该列作为主键,如果没有MySQL就会生成一列row_id隐藏列作为主键。
  • trx_id
    当前记录项的事务id,6字节,每开始一个新的事务时,系统版本号会自动递增,而事务开始时刻的系统版本号会作为事务id,事务 commit 的话,就会更新trx_id。
  • roll_pointer
    undo log 指针,7字节,指向当前记录项的 undo log,找之前版本的数据需通过此指针。如果事务回滚的话,则从 undo Log 中把原始值读取出来再放到记录中去。

2.MVCC 原理

基于行记录中隐藏的列,实际上每行记录,可能会有多个版本的数据。当一个事务启动时,会先向MySQL申请一个事务ID(按照申请顺序严格递增的)。在本事务ID之前已经提交的事务,本事务可见,否则,就要根据行数据的roll_pointer指针往前找,直到找到符合条件的数据版本。因此有了这个事务ID,就可以根据行数据隐藏列的trx_id,roll_pointer,找到对应可见版本的数据,也就是拥有了一个整个数据库的快照。
在实现上, InnoDB 为每个事务构造了一个数组,用来保存这个事务启动瞬间,当前正在“活跃”的所有事务 ID。“活跃”指的就是,启动了但还没提交。数组里面事务 ID 的最小值记为低水位,当前系统里面已经创建过的事务 ID 的最大值加 1 记为高水位。这个视图数组和高水位,就组成了当前事务的一致性视图(read-view)。而数据版本的可见性规则,就是基于数据的 row trx_id 和这个一致性视图的对比结果得到的。
mvcc
这样,对于当前事务的启动瞬间来说,一个数据版本的 row trx_id,有以下几种可能:

  • 如果落在绿色部分,表示这个版本是已提交的事务或者是当前事务自己生成的,这个数据是可见的
  • 如果落在红色部分,表示这个版本是由将来启动的事务生成的,是肯定不可见的;
  • 如果落在黄色部分,那就包括两种情况
    a. 若 row trx_id 在数组中,表示这个版本是由还没提交的事务生成的,不可见;
    b. 若 row trx_id 不在数组中,表示这个版本是已经提交了的事务生成的,可见。

3.当前读

当执行update、或者select加锁(select … lock in share mode、select … for update)时,事务读取数据最新的数据,叫做当前读。

  大数据 最新文章
实现Kafka至少消费一次
亚马逊云科技:还在苦于ETL?Zero ETL的时代
初探MapReduce
【SpringBoot框架篇】32.基于注解+redis实现
Elasticsearch:如何减少 Elasticsearch 集
Go redis操作
Redis面试题
专题五 Redis高并发场景
基于GBase8s和Calcite的多数据源查询
Redis——底层数据结构原理
上一篇文章      下一篇文章      查看所有文章
加:2022-03-08 22:34:18  更:2022-03-08 22:38:05 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2025年1日历 -2025/1/16 20:05:47-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码