索引:
index帮助mysql高效获取数据的数据结构, 排好序的快速查找数据结构 在数据之外,数据库系统还维护着满足特定查找算法的数据结构,这些数据结构以某种方式指向数据,这样就可以在数据结构的基础上实现高级查找算法
索引多指B树(多路搜索树,并不一定是二叉树)
优势:
- 类似大学图书馆书目索引,提高数据检索的效率,降低数据库的IO成本
- 降低排序成本,降低cpu消耗
劣势:
- 索引也是一张表,该表保存了主键与索引字段,并指向实体类的记录,故索引列也是要占用空间的。
- 建立索引虽然提高的查询速度,同时也降低了更新表的速度,比如进行insert,update,delete,因为在更新表的时候,MySQL不仅要保存数据,还要保存索引文件每次更新添加了索引列的字段,都会调整因为更新带来的键值变化后的索引信息。
索引分类:
- 单值索引:一个索引只包含单个列,一个表可以有多个单值索引
- 唯一索引:索引列的值必须唯一,但允许有空值
- 复合索引:一个索引包含多个列
索引的基本语法:
- 创建:
- create [unique] index 索引名 on 表名(列名(长度))
- alter 表名 add [unique]index 索引名 on 表名(列名(长度))
- 删除:drop index 索引名 on 表名
- 查看:show index from 表名
索引结构与检索原理
初始化:一颗B+树,如图磁盘块包含几个数据项(深蓝色)和指针(黄色),如磁盘块1包含数据项17和35,包含指针p1,p2,p3,其中p1指向的是小于17的磁盘块,p2指向17到35之间的磁盘块,p3指向大于35的磁盘块,往下依次类推同理。
注意:
- 真实的数据存在叶子节点,即上图中的第三层
- 非叶子节点不存储真实的数据,只存储指引搜索方向的数据项,如上图中的第一层的17,35并不真实存在数据表中
查找过程:
在上图中,假如我们要查找的数据项是29,首先把磁盘块1由磁盘加载到内存中,此时发生一次IO,在内存中用二分查找确定29在17和35之间,进而锁定磁盘块1中的p2指针。然后通过磁盘块1的p2指针的磁盘地址把磁盘快3由磁盘加载到内存,发生第二次IO,29在26和和之间,进而在锁定磁盘块3中的p2指针,通过指针加载磁盘块8到内存,发生第三次IO,然后在内存中通过二分查找找到29。整个过程,一共进行三次IO,就查询到了我们要找的数据。
哪些情况需要建立索引
- 主键自动建立索引
- 频繁作为查询条件的字段应该创建索引
- 查询中与与其他表关联的字段,外键关系建立索引
- 频繁更新的字段不适合创建索引,因为更次更新索引,会加重IO负担
- where条件里用不到的字段不创建索引
- 单键/组合索引的选择问题,在高并发下倾向创建组合索引
- 查询中排序的字段,排序字段若通过索引去访问将大大提高排序速度
- 查询中统计或者分组字段
不适合建立索引的情况
- 表记录太少
- 经常增删改的表
- 注意:如果某个数据列包含许多重复的内容,为它建立索引没有太大的实际效果。
本期分析到这,笔记基于尚硅谷的MYSQL高级教程,感兴趣的伙伴可以去看看哦!!!
|