一. 索引概述
是帮助 mysql 高效 获取数据 的 数据结构(有序)。在数据之外,数据库系统还维护着满足特定查找算法的数据结构,这些数据结构以某种方式引用数据,这样就可以在这些数据结构上实现高级查找算法,这种数据结构就是索引。 简言之,索引是一种数据结构,用来高效获取数据的。
无索引,则会全表扫描,因为无法确定后面是否仍有相同数据; 选择一种数据结构做索引,查找数据会十分高效。
优缺点:
优势: 1.提高数据检索的效率,降低数据库的io成本; 2.通过索引列对数据进行排序,降低数据排序的成本,降低cpu的消耗。 劣势: 1.索引列也是要占用空间的; 2.索引大大提高了查询效率,同时却也降低更新表的速度,如进行增删改时,效率降低。
二. 索引结构
在 存储引擎层 实现。
b+tree索引:最常见的索引类型; Hash索引:使用hash表实现的,只有精确匹配索引列的查询才有效,不支持范围查询; R-tree(空间索引):属于MyISAM的一个特殊索引类型,属于地理空间数据类型,通常使用较少; Full-text(全文索引):是一种通过建立倒排索引,快速匹配文档的方式。
二叉树:缺点在于,顺序插入时,会形成一个链表(通过红黑树解决),查询性能大大降低,在大数据量情况下,层级越深,检索速度越慢。 B-Tree(多路平衡查找树):n个key,则n+1个指针。
B+Tree:所有数据都会出现在叶子节点;叶子节点形成一个单向链表。 hash(memory引擎) 哈希索引就是采用一定的hash算法,将键值换算成新的hash值,映射到对应的槽位上,然后存储在hash表中。一般采取链表解决hash冲突或碰撞。 1.只能用于对等比较(=,in),不支持范围查询(between ,>, <) 2.无法利用索引完成排序; 3. 查询效率高,通常一次检索即可。高于B+Tree索引
为什么选择B+Tree作为索引结构
1.相对于二叉树,层级更少,搜索效率高; 2.对于B-Tree,结点均会保存数据,导致页中存储的键值减少,指针跟着减少,要保存大量数据,只能增加树的高度,导致性能降低; 3.相对于hash,b+Tree支持范围匹配及排序操作。
|