| |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
-> 数据结构与算法 -> InnoDB引擎架构 -> 正文阅读 |
|
[数据结构与算法]InnoDB引擎架构 |
逻辑存储结构表空间(ibd文件):一个mysql实例可以对应多个表空间,用于存储记录、索引等数据 段:分为数据段、索引段、回滚段、InnoDB是索引组织表,数据段就是B+树的叶子节点,索引段即为B+树的非叶子节点,段用来管理多个Extent(区) 区:表空间的单元结构,每个区的大小为1M,默认情况下,InnoDB存储引擎页大小为16K,即一个区中一共有64个连续的页 页:是InnoDB存储引擎磁盘管理的最小单元,每个页的大小默认16KB,为了保证页的连续性,InnoDB存储引擎每次从磁盘申请 4~5个区 行:InnoDB存储引擎是按行进行存放的 Trx_id:每次对某条记录进行改动时,都会把对应事务的ID赋值给 trx_id 隐藏列,也即是最后一次操作事务的ID Roll_pointer:每次对某条记录进行改动时,都会把旧版本写入到 undo 日志中,然后这个隐藏列就相当于一个指针,可以通过它来找到该记录修改前的信息 架构内存结构:左内存、右磁盘、中线程 ?内存Buffer Pool:缓冲池是内存中的一个区域,里面可以缓存磁盘上经常操作的真实数据,在执行增删改查操作时,先操作缓冲池中的数据(若没数据,从磁盘加载并缓存),然后再以一定频率刷新到磁盘,减少磁盘IO,加快处理速度 没有缓冲区,每一次增删改查操作都回去操作磁盘k空间,就会存在大量磁盘IO,在业务中磁盘IO是随机IO 非常耗费性能 缓冲池以页为单位,底层采用链表数据结构管理Page,根据状态,将Page分为三种类型 ????????free page:空闲page,未被使用 ????????clean page:被使用page,数据没有被修改过 ????????dirty page:脏页,被使用page,数据被修改过,数据与磁盘中数据不一致 Change Buffer:更改缓冲区在执行DML语句时,如果这些数据Page没有在Buffer Pool中,不会直接操作磁盘,而会将数据变更存在更改缓冲区Change Buffer中,在未来数据被读取时,再将数据合并恢复到Buffer Pool中,再将合并后的数据刷新到磁盘 作用:每一次操作磁盘会造成大量磁盘IO,有了ChangeBuffer之后,可以在缓冲池中进行合并处理,减少磁盘IO 自适应Hash用于优化对Buffer Pool数据的查询,InnoDB会监控对表上各索引页的查询,如果发现Hash索引可以提升速度,则创建Hash索引 Log Buffer日志缓冲区,保存要写入磁盘中的Log日志数据,默认16MB,日志会定期刷新到磁盘中,如果需要更新、插入或删除许多行的事务,增加日志缓冲区大小可以节省磁盘IO 参数: InnoDB_log_buffer_size : 缓冲区大小 InnoDB_flush_log_at_trx_commit:日志刷新到磁盘时机 1:每次事务提交刷新到磁盘 0:每秒日志写入并刷新到磁盘 2:每次事务提交后,并每秒刷新到磁盘 磁盘System Tablespace:系统表空间是更改缓冲区的存储区域,如果表是在系统表空间而不是每个表文件或通用表空间中创建的,它也可能包含表和索引数据(5.x版本还包括InnoDB数据字典,undolog等) ????????参数设置:innodb_data_file_path File-Per-Tbale Tablespace:每个表的文件表空间包含单个InnoDB表的数据和索引,并存储在文件系统上的单个数据文件中 ????????参数设置:innodb_file_per_table General Tablespaces:通用表空间,需要通过 create TableSpace 语法创建,创建表时可指定 Undo Tablespaces:撤销表空间,MySQL实例在初始化时会自动创建两个默认的undo表空间(默认16M),用于存储undo log日志 Temporary Tablespaces:InnoDB会使用会话临时表空间和全局临时表空间,存储用户创建的临时表数据等 Doublewrite Buffer Files:双写缓冲区,InnoDB引擎将数据页从Buffer Pool刷新到磁盘前,先将数据页写入双写缓冲区文件中,便于系统异常时恢复数据 Redo Log:重做日志,实现事务的持久性,由重做日志缓冲和重做日志文件组成,前者是在内存中,后者在磁盘中, 事务提交后,会把所有修改信息都放到该日志中,用于刷新脏页到磁盘时发生错误,进行数据恢复 后台线程作用:将InnoDB缓冲池中的数据在合适的时机刷新到磁盘文件中 1.Master Thread 核心后台线程,负责调度其他线程,还负责将缓冲池中的数据异步刷新到磁盘中,保持数据的一致性,还包括脏页的刷新、合并插入缓存、undo页的回收 2.IO Thread 在InnoDB存储引擎中大量使用了AIO来处理IO请求,这样可以极大地提高数据库的性能,而IO Thread主要负责这些IO请求的回调 ?3.Purge Thread 主要用于回收事务已经提交了的undo Log,在事务提交之后,undo Log可能不用了,就用它来回收 4.Page Cleaner Thread 协助 Master Thread 刷新脏页到磁盘的线程,它可以减轻Master Thread 的工作压力,减少阻塞 事务原理概念事务是一组操作的集合,它是一个不可分割的工作单位,事务会把所有的操作作为一个整体一起向系统提交或撤销操作请求,这些操作要么同时成功,要么同时失败 事务特性ACID1.原子性(Atomicity) 一个事务必须被视为一个不可分割的最小单元, 整个事务中的所有操作要么全部提交成功, 要么全部失败,对于一个事务来说,不可能只执行其中的一部分操作 2.一致性(Consistency) 如果在执行事务之前数据库是一致的,那么在执行事务之后数据库也还是一致的; 3.隔离性(Isolation) 事务操作之间彼此独立和透明互不影响。事务独立运行。这通常使用锁来实现。 一个事务处理后的结果,影响了其他事务,那么其他事务会撤回。 事务的100%隔离,需要牺牲速度。 4.持久性(Durability) 事务一旦提交,其结果就是永久的。即便发生系统故障,也能恢复。 持久性由redo log保证 Redo Log:重做日志,实现事务的持久性,由重做日志缓冲和重做日志文件组成,前者是在内存中,后者在磁盘中, 事务提交后,会把所有修改信息都放到该日志中,用于刷新脏页到磁盘时发生错误,进行数据恢复 ? 原子性由undo log保证 undo log:回滚日志,用于记录数据被修改前的信息,作用包含:提供回滚和MVCC(多版本并发控制) 它和redo log 记录物理日志不一样,它是逻辑日志,可以认为当delete一条记录时,undo log中会记录一条对应的insert记录,反之亦然,当update一条记录时,会记录一条对应相反的update记录,执行rollback时,就可以从undo log中的逻辑记录读取到相应内容并回滚 Undo log销毁:在事务执行时产生,事务提交时,并不会立即删除undo log,这些日志可能还用于MVCC Undo log存储:采用段的方式进行管理和记录,存放在rollback回滚段中,内部包含1024个 undo log segment MVCC概念MVCC,全称?Multi-Version Concurrency Control?,即多版本并发控制。指维护一个数据的多个版本,使得读写操作没有冲突,快照读为MySQL实现MVCC提供了一个非阻塞读功能。MVCC的具体实现还需要依赖于数据库记录中的三个隐式字段、undo log日志、readView 当前读读取的是记录的最新版本,读取时还要保证其他并发事务不能修改当前记录,会对读取的记录进行加锁。对于日常操作,如:select ... lock in share mode(共享锁),select ... for update、update、insert、delete(排它锁)都是一种当前读 快照读简单的select(不加锁)就是快照读,快照读读取的是记录数据的可见版本,有可能是历史数据,不加锁是非阻塞锁 ? ? ? ? Read Committed:每次select,都生成一个快照读 ? ? ? ? Repeatable Read:开启事务后第一个select语句才是快照读的地方 ? ? ? ? Serializable:快照读会退化为当前读 数据库并发场景有三种:读-读:不存在任何问题,也不需要并发控制
|
|
|
上一篇文章 下一篇文章 查看所有文章 |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 | -2024/11/26 16:53:32- |
|
网站联系: qq:121756557 email:121756557@qq.com IT数码 |