IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 数据结构与算法 -> mysql 索引 -> 正文阅读

[数据结构与算法]mysql 索引

索引本质上是一种排好序的数据结构,需要消耗一定的磁盘空间,相当于是空间换时间的思想;

一. 索引的基本概述

1. 主键索引

主键索引也叫作聚簇索引,主键会默认加上索引,主键索引在创建表的时候自动创建,主键索引不允许为空:

# 创建一张表
create table t_user(id varchar (20) primary key, name varchar(20));
# 查看一张表中存在哪些索引
show index from t_user

2. 单列索引

也叫单值索引,普通索引,单列索引有两种创建方式:① 建表的时候创建;② 建表之后创建,例如我们有t_user表,想给t_user表的name属性添加单列索引:

# 建表的时候创建单列索引, key()表示给哪个属性添加索引, 但是这种方式在无法指定索引的名字
create table t_user(id varchar(20) primary key, name varchar(20), key(name))
# 建表之后创建单列索引, 其中index_name 表示索引的名字, t_user 表示哪一张表, name表示表中的哪个属性
create index name_index on t_user(name)

建表时创建单列索引:

建表后创建单列索引:

3. 唯一索引

存在两种方式创建唯一索引,在建表的时候创建或者是建表之后创建:

# 建表的时候创建
create table t_user(id varchar(20) primary key, name varchar(20), unique(name))
# 建表之后创建
create unique index name_index on t_user(name)

4. 复合索引

复合索引需要匹配多个多个列共同构建一个索引,也存在两种创建方式,可以在创建表的时候创建也可以在创建表之后创建:

# 建表的时候创建
create table t_user(id varchar(20) primary key, name varchar(20), age int, key(name, age))
# 建表之后创建
create index name_index on t_user(name, age)

?这里需要注意一个面试题,例如当前我是根据name,age,bir 三个字段创建的复合索引,判断下面的字段是否可以利用索引:

  1. name bir age 能否利用索引;可以
  2. name age bir 能否利用索引;可以
  3. age bir 能否利用索引;不可以,没有包括左前缀
  4. bir age name 能否利用索引;可以
  5. age bir 能否利用索引;不可以,没有包括左前缀

① 如果当前是复合索引那么需要遵循最左前缀原则才能够利用索引,所以字段为(a,b,c)的时候只能够通过(a),(a,b),(a,b,c)来查询才可以利用复合索引;

② mysql 引擎在查询的时候为了更好地利用索引,在查询的过程中会动态调整查询字段顺序以便利用索引;

二. 索引底层原理解析值B+树

先思考一个问题,现在有一张表t_emp,插入几条数据,我们可以先查询一下:select * from t_emp,可以发现插入的数据是无序的但是查询的结果大概是有序的,为什么它要对id 进行排序呢?原因是主键id 默认会创建主键索引,主键索引进行了排序,排序之后从前往后找的时候就可以比较快的查询出结果,如果没有排序那么就需要整个表中进行查询那么查询的速度就会比较慢,但是怎么样做排序的呢?主键索引在我们每一次插入的时候会对我们的数据做一个排序并且会对我们排序之后的最后一个把所有的数据链接起来,但是mysql 优化到这里并不是最优的,因为表中的数据可能成千上万,所以对于链表来说查询的时间复杂度就是O(n),mysql 对此做了一个优化把这些底层排好序的数据基于页来管理,mysql 中每一页默认存储大小为16 KB,并且mysql 又做了一层页目录进行管理,页目录存储每一页的第一个索引的id和对应的指针,(页目录其实也是一种数据结构),通过指针找到对应的是哪一页;进行页目录管理之后首先是从页目录中去找,页目录大小也是16KB;例如上面我们创建的三个字段,id,age各占4个字节,varchar 20个字节,指针4~8个字节,这里算为8个字节,那么总共是36个字节,也即32B,而一页16KB,则16 * 1024 / 36?= 455?条数据,页目录可以放16 KB * 1024 / 12 = 1365条,所以两阶的B+树可以存储455 * 1365 =?621075,对于大部分情况下两层B+树就可以实现存储大部分数据了;

create table t_emp(id int primary key, name varchar(20), age int)
# 插入数据
insert into t_emp values(5, 'd', 22);
insert into t_emp values(6, 'd', 22);
insert into t_emp values(7, 'e', 21);
insert into t_emp values(1, 'a', 23);
insert into t_emp values(2, 'b', 26);
insert into t_emp values(3, 'c', 27);
insert into t_emp values(4, 'a', 32);
insert into t_emp values(8, 'f', 53);
insert into t_emp values(9, 'v', 13);
# 查看当前t_emp中的索引
show index from t_emp
select * from t_emp

?

优化:

?

?B+树最大的好处是只有叶子节点存储数据,非叶子节点不存储数据,B树的节点必须存数据,所以在存储页数据的时候势必需要消耗更多的空间来存储,所以同样的两级存储的数据会多一点,mysql 为了加快查询在Innodb设置的时候,顶层页是常驻内存的,也就是说查找某一个键值的行记录的时候最多只需要1~3次IO操作;

  数据结构与算法 最新文章
【力扣106】 从中序与后续遍历序列构造二叉
leetcode 322 零钱兑换
哈希的应用:海量数据处理
动态规划|最短Hamilton路径
华为机试_HJ41 称砝码【中等】【menset】【
【C与数据结构】——寒假提高每日练习Day1
基础算法——堆排序
2023王道数据结构线性表--单链表课后习题部
LeetCode 之 反转链表的一部分
【题解】lintcode必刷50题<有效的括号序列
上一篇文章      下一篇文章      查看所有文章
加:2022-05-13 11:54:55  更:2022-05-13 11:55:29 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 -2024/11/26 4:23:16-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码