IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 大数据 -> 【MySQL InnoDB 读书笔记】09 InnoDB 下逻辑存储结构(二):数据页的逻辑存储及实现 -> 正文阅读

[大数据]【MySQL InnoDB 读书笔记】09 InnoDB 下逻辑存储结构(二):数据页的逻辑存储及实现

一、InnoDB 数据页存储结构

innodb 存储引擎数据页结构如图所示:
在这里插入图片描述

InnoDB 数据页由 7 个部分组成:

  • File Header :文件头
  • Page Header:页头
  • Infimun 和 Supremum Records
  • User Records:用户记录,即行记录
  • Free Space:空闲空间
  • Page Directory:页目录
  • File Trailer:文件结尾信息

1. File Header

File Header用来记录页的一些头信息,共占用 38 个字节,具体记录了哪些信息如下表所示:

名称大小说明
FIL_PAGE_SPACE_OR_CHKSUM4MySQL 版本 4. 0 之前该值为 0,版本 4.0 之后该值代表页的 checksum 值
FIL_PAGE_OFFSET4表空间中页的偏移量,表示当前页在所有页中的偏移量,例如(10,1)表示查找表空间 ID 为 10 的第二个页
FIL_PAGE_PREV4当前页的上一个页,B+ 树的叶子节点之间链接形成双向链表
FIL_PAGE_NEXT4当前页的下一个页,B+ 树的叶子节点之间链接形成双向链表
FIL_PAGE_LSN8代表当前页最后被修改的日志序列位置
FIL_PAGE_TYPE2InnoDB 存储引擎页的类型
FIL_PAGE_FILE_FLUSH_LSN8该值仅仅在 系统表空间 的一个页中定义,对于独立表空间该值为0,含义是文件至少被更新到了该 LSN 值
FIL_PAGE_ARCH_LOG_NO_OR_SPACE_ID4MySQL 版本 4.1 之后,该值表示页属于哪个表空间
  • FIL_PAGE_TYPE的取值和含义如下表所示:
/** File page types (values of FIL_PAGE_TYPE) @{ */
#define FIL_PAGE_INDEX		17855	/*!< B-tree node */
#define FIL_PAGE_RTREE		17854	/*!< B-tree node */
#define FIL_PAGE_UNDO_LOG	2	/*!< Undo log page */
#define FIL_PAGE_INODE		3	/*!< Index node */
#define FIL_PAGE_IBUF_FREE_LIST	4	/*!< Insert buffer free list */
/* File page types introduced in MySQL/InnoDB 5.1.7 */
#define FIL_PAGE_TYPE_ALLOCATED	0	/*!< Freshly allocated page */
#define FIL_PAGE_IBUF_BITMAP	5	/*!< Insert buffer bitmap */
#define FIL_PAGE_TYPE_SYS	6	/*!< System page */
#define FIL_PAGE_TYPE_TRX_SYS	7	/*!< Transaction system data */
#define FIL_PAGE_TYPE_FSP_HDR	8	/*!< File space header */
#define FIL_PAGE_TYPE_XDES	9	/*!< Extent descriptor page */
#define FIL_PAGE_TYPE_BLOB	10	/*!< Uncompressed BLOB page */
#define FIL_PAGE_TYPE_ZBLOB	11	/*!< First compressed BLOB page */
#define FIL_PAGE_TYPE_ZBLOB2	12	/*!< Subsequent compressed BLOB page */
#define FIL_PAGE_TYPE_UNKNOWN	13	/*!< In old tablespaces, garbage in FIL_PAGE_TYPE is replaced with this value when flushing pages. */
#define FIL_PAGE_COMPRESSED	14	/*!< Compressed page */
#define FIL_PAGE_ENCRYPTED	15	/*!< Encrypted page */
#define FIL_PAGE_COMPRESSED_AND_ENCRYPTED 16/*!< Compressed and Encrypted page */
#define FIL_PAGE_ENCRYPTED_RTREE 17	/*!< Encrypted R-tree page */
常量名称十六进制含义
FIL_PAGE_INDEX0x45BFB+ 数叶子节点(数据节点)
FIL_PAGE_UNDO_LOG0x0002undo log 页
FIL_PAGE_INODE0x0003索引节点
FIL_PAGE_IBUF_FREE_LIST0x0004insert buffer 空闲列表页
FIL_PAGE_TYPE_ALLOCATED0x0000最新分配还未使用的页
FIL_PAGE_IBUF_BITMAP0x0005insert buffer 位图页
FIL_PAGE_TYPE_SYS0x0006系统页
FIL_PAGE_TYPE_TRX_SYS0x0007事务系统数据页
FIL_PAGE_TYPE_FSP_HDR0x0008File Space Header 页
FIL_PAGE_TYPE_XDES0x0009扩展描述页
FIL_PAGE_TYPE_BLOB0x000ABLOB 页

2. Page Header

Page Header 用来记录数据页的状态信息,共占用 56 字节,具体信息如下表所示:

名称大小(字节)说明
PAGE_N_DIR_SLOTS2表示页目录(Page Directory)中的槽(Slot)数量
PAGE_HEAP_TOP2记录在页中是以堆的形式存放的,该值存放的是指向第一个记录的指针
PAGE_N_HEAP2堆中的记录数,一共占用 2 个字节
PAGE_FREE2指向可重用空间的首指针
PAGE_GARBAGE2行记录中 delete flag 为 1 的总字节数,即被删除的记录的大小总和
PAGE_LAST_INSERT2最后插入记录的位置
PAGE_DIRECTION2最后插入的方向
PAGE_N_DIRECTION2一个方向连续插入记录的数量
PAGE_N_RECS2该页中记录的数量
PAGE_MAX_TRX_ID8修改当前页的最大事务ID,注意该值仅在 Secondary Index 中定义
PAGE_LEVEL2当前页在索引树中的位置,0x00表示叶节点
PAGE_INDEX_ID8索引ID,表示当前页属于哪个索引
PAGE_BTR_SEG_LEAF10B+ 树数据页非叶节点所在段的 segment header
PAGE_BTR_SEG_TOP10B+ 树数据页所在段的 segment header

3. Infimun Records 和 Supremum Records

Infimun 记录是比该页中任何主键值都要小的值,Supremum 记录是比任何可能大的值还要大的值,这两个值在页创建时被建立,并且在任何情况下都不会被删除。这两个记录位于页中的所有航记录数据的收尾处,如图所示:
在这里插入图片描述

4. User Records

User Records实际存储行记录的内容,如图:

在这里插入图片描述

5. Free Space

Free Space指的是空闲空间,同样也是使用链表来进行组织的,在一条记录被删除后,该空间会被自动加入到空闲列表中

6. Page Directory

Page Directory顾名思义是这个页的所有记录的一个目录,存放着数量可变记录指针,这些指针指向页中存放的记录,有时记录指针被称为,所以Page Directorty有时被称为目录槽,在InnoDB页面中并不是一个记录指针对应一个记录,而是若干个(1~8)记录对应一个记录指针,在完整的页面中,每六条记录将有一个槽。

记录的头信息中有一个大小为4位的n_owned,表示管理当前记录的槽一共管理了多少个记录。

举例:如果一个页中的记录是‘A’、‘B’、‘F’、‘D’,记录指针将是(pointer to ‘A’)、(pointer to ‘B’)、(pointer to ‘D’)、(pointer to ‘F’)

image-20211226131936925

由举例可知,指针的排列顺序是按照键值的顺序排列的,故在查找某一条记录时,可以通过二分查找的方式进行查找

所以查找一条记录的过程为:先在 B+ 树上定位到记录所在的叶子节点(数据页),然后将整个数据页载入到内存中,然后在目录槽中进行二分查找目标记录所在的槽,然后在槽所管理的若干条记录中寻找目标记录

7. File Trailer

为了检测页向磁盘中写入的过程中是否产生损坏,在 InnoDB 存储引擎页中设置了 File Trailer 来做检验。

File Trailer 组成:只有一个 FIL_PAGE_END_LSN 部分,占用 8 字节,前 4 字节代表此页的 checksum 值,最后 4 字节和 File Header 中的 FIL_PAGE_LSN 相同

image-20211226140515503

检查原理:将 8 字节的 File Trailer 与 File Header 中的 FIL_PAGE_SPACE_OR_CHKSUM 和 FIL_PAGE_LSN 组成的 8 字节作比较(并不是简单的等值比较,而是需要通过检查 checksum 的算法)。

检查 checksum 的算法:通过参数innodb_checksum_algorithm 来控制,可设置的算法有:crc32、none、strict_innodb、strict_crc32、strict_none,其中strict_*的算法表示严格按照设置的算法进行页的检测

MySQL [(none)]> show variables like 'innodb_checksum_algorithm'\G;
*************************** 1. row ***************************
Variable_name: innodb_checksum_algorithm
        Value: crc32
1 row in set, 1 warning (0.08 sec)

是否开启对页的完整性检查由参数innodb_checksums控制:

MySQL [(none)]> show variables like 'innodb_checksums'\G;
*************************** 1. row ***************************
Variable_name: innodb_checksums
        Value: ON
1 row in set, 1 warning (0.00 sec)
  大数据 最新文章
实现Kafka至少消费一次
亚马逊云科技:还在苦于ETL?Zero ETL的时代
初探MapReduce
【SpringBoot框架篇】32.基于注解+redis实现
Elasticsearch:如何减少 Elasticsearch 集
Go redis操作
Redis面试题
专题五 Redis高并发场景
基于GBase8s和Calcite的多数据源查询
Redis——底层数据结构原理
上一篇文章      下一篇文章      查看所有文章
加:2021-12-28 22:59:51  更:2021-12-28 23:02:27 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2025年1日历 -2025/1/17 3:47:53-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码