| |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
-> 大数据 -> 索引优化分析,必备掌握知识???(熬夜3个晚上写的,建议必读) -> 正文阅读 |
|
[大数据]索引优化分析,必备掌握知识???(熬夜3个晚上写的,建议必读) |
目录 一、?<分析性能下降SQL慢,执行时间长、等待时间长的原因> ? ? MySQL Query Optimizer (MySQL 查询 优化器) 简介本文章主要分享一下索引优化分析这点事,这也是自己在学习这部分知识的时候累积的,文章主要包含五部分,分别为<分析性能下降SQL慢,执行时间长的原因>、<常见的通用join查询>、<索引简介>、<性能分析>、<索引优化>。 一、?<分析性能下降SQL慢,执行时间长、等待时间长的原因>? ? ? ? 总结一下几点: ? ? ? ? ? ? ? ? 1. 查询语句写的烂 ? ? ? ? ? ? ? ? 2. 索引失效(单值、复合) ? ? ? ? ? ? ? ? 3.关联查询太多join(设计缺陷或不得已的需求) ? ? ? ? ? ? ? ? 4.服务器调优及各个参数设置(缓冲、线程数等) 二、?<常见通用的Join查询>? ? ?SQL执行顺序? ? ? ? 1)手写SQL
? ? ? ? 2)机读SQL
? ? ?Join图? ? ?? ? ? ? ?如图,可以看出有7种join连接的方式,分别对应着sql语句,不明白可以试着写一下,理解理解。 三、?<索引>?????索引是什么?? ? ? ? 1)Mysql官方对索引的定义为:索引(Index)是帮助Mysql高效获取数据的数据结构 ? ? ? ? 2)可以简单理解为“排好序的快速查找数据结构”。 ? ? ? ?详解:在数据之外,数据库系统还维护这满足特定查找算法的数据结构,这些数据结构以某种方式引用(指向)数据,这样就可以在这些数据结构上实现高级查找算法。这种数据结构,就是索引。下图就是一种可能的索引方式示例: ???????? ?为了加快Col2的查找,可以维护一个右边所示的二叉树,每个节点分别包含索引键值和一个指向对应数据记录物理地址的指针,这样就可以运用二叉树查找在一定的复杂度内获取到响应数据,从而快速的检索出符合条件的记录。 ? ? ? ? ?3)一般来说索引本身也很大,不可能全部存储在内存中,因此索引往往以索引文件的形式存储在硬盘上 ? ? ? ? 4)我们平常所说的索引,如果没有特别指明,都是指B树(多路搜索树,并不一定是二叉的)结构组织的索引。其中聚集索引,次要索引,覆盖索引,复核索引,前缀索引,唯一索引默认都是使用B+树索引,统称索引。当然,除了B+树这种类型的索引之外,还有哈希索引(hash index)等。 ? ? ?优势? ? ? ? 1.提高数据检索效率,降低数据库的IO成本 ? ? ? ? 2.通过索引列对数据进行排序,降低数据排序的成本,降低了CPU的消耗 ?????劣势? ? ? ? 1.占用空间(实际上索引也是一张表,该表保存了主键与索引字段,并指向实体表的记录,所以索引列也是要占用空间的) ? ? ? ? 2.会降低更新表的速度。(虽然索引大大提高了查询速度,同时却会降低更新表的速度,如对表进行INSERT、UPDATE和DELETE。因为更新表时,Mysql不仅要保存数据,还要保存一下索引文件每次更新添加索引列的字段) ? ? ? ? 3.索引知识提高效率的一个因素,如果Mysql有大数据量的表,就需要花时间研究建立最优秀的索引,或者优化查询 ? ? ?Mysql索引分类? ? ? ? 单值索引:即一个索引只包含单个列,一个表可以有多个单列索引 ? ? ? ? 唯一索引:索引列的值必须唯一,但允许有空值 ? ? ? ? 复合索引:即一个索引包含多个列 ? ? ?基本语法
? ? ?Mysql索引结构? ? ? ? BTree索引、Hash索引、FULLTEXT全R-文索引、R-Tree索引 ? ? ?哪些情况需要创建索引?(面试重点)? ? ? ? 1.主键自动建立唯一索引 ? ? ? ? 2.频繁作为查询条件的字段应该创建索引 ? ? ? ? 3.查询中与其他表关联的字段,外键关系建立索引 ? ? ? ? 4.频繁更新的字段不适合创建索引(因为每次更新不单单是更新了记录还会更新索引) ? ? ? ? 5.Where条件里用不到的字段不创建索引 ? ? ? ? 6.单键/组合索引的选择问题,who?(在高并发下倾向创建组合索引) ? ? ? ? 7.查询中排序的字段,排序字段若通过索引去访问将大大提高排序速度 ? ? ? ? 8.查询中统计或分组字段 ? ? ?哪些情况不要创建索引?(面试重点)? ? ? ? 1.表记录太少 ? ? ? ? 2.经常增删改的表(提高了查询速度,同时却会降低更新表的速度,如对表进行INSERT、UPDATE、DELETE.因为更新表时,Mysql不仅要保存数据,还要保存一下索引文件) ? ? ? ? 3.数据重复且分布平均的表字段,因此应该只为最经常查询和最经常排序的数据列建立索引。 ? ? ? ? ? ? ?注:如果某个数据列包含许多重复的内容,为它建立索引就没有太大的实际效果。 四、?<性能分析>? ? MySQL Query Optimizer (MySQL 查询 优化器)? ? ? ? 1.Mysql中有专门负责优化SELECT语句的优化器模块,主要功能:通过计算分析系统中收集到的统计信息,为客户端请求的Query提供他认为最优的执行计划(他认为最优的数据检索方式,但不见是DBA认为是最优的,这部分最耗费时间) ? ? ? ? 2.当客户端向Mysql请求一条Query,命令解析器模块完成请求分类,区别出是SELECT并转发给MySql Query Optimizer时,Mysql Query Optimizer首先会对整条Query进行优化,处理掉一些常量表达式的预算,直接换算成常量值。并对Query中的查询条件进行简化和转换,如去掉一些无用或显而易见的条件、结构调整等。然后分析Query中的Hint信息(如果有),看显示Hint信息是否可以完全确定该Query的执行计划。如果没有Hint或Hint信息还不足以完全确定执行计划,则会读取所涉及对象的统计信息,根据Query进行写相应的计算分析,然后再得出最后的执行计划。 ?????MySQL常见瓶颈? ? ? ? 1.CPU:CPU在饱和的时候一般发生在数据装入内存或从磁盘上读取数据时候 ? ? ? ? 2.IO:磁盘I/O瓶颈发生在装入数据远大于内存容量的时候 ? ? ? ? 3.服务器硬件的性能瓶颈:top,free,iostat和vmstat来查看系统的性能状态 ? ? ?Explain? ? ? ? 1)Explain是什么?(查看执行计划)? ? ? ? ? ? ? ?使用Explain关键字可以模拟优化器执行SQL查询语句,从而知道Mysql是如何处理你的SQL语句。官网介绍-查看Optimization。 ? ? ? ? 2)Explain能干嘛?? ? ? ? ? ? ? ? a.表的读取顺序、 ? ? ? ? ? ? ? ? b.数据读取操作的操作类型、 ? ? ? ? ? ? ? ? c.哪些索引可以使用、 ? ? ? ? ? ? ? ? d.哪些索引被实际使用、???????? ? ? ? ? ? ? ? ? e.表之间的引用、 ? ? ? ? ? ? ? ? f.每张表有多少行被优化器查询 ? ? ? ? 3)Explain怎么玩?? ? ? ? ? ? ? ? 语法:? Explain + SQL语句; ? ? ? ? ? ? ? ? ?执行计划包含息:如图 ? ? ? 名字段解释? ? ? ? ?1)id? ? ? ? ? ? ?select查询的序列号,包含一组数字,表示查询中执行select子句或操作表的顺序 ? ? ? ? ? ? ?三种情况: ? ? ? ? ? ? ?1> id相同,执行顺序由上至下 ? ? ? ? ? ? ? ?2> id不同,如果是子查询,id的序号会递增,id的值越大优先级越高,越先被执行 ? ? ? ? ? ? ? ? 3> id相同不同,同时存在 ? ? ? ? ?2)select_type? ? ? ? ? ? ? 查询的类型,主要是用于区别普通查询、联合查询、子查询等的复杂查询。 ? ? ? ? ? ? ??
? ? ? ? ?3)table? ? ? ? ? ? ? ? 显示这一行数据是关于哪张表的 ? ? ? ? ?4)type? ? ? ? ? ? ? ?Explain_type图,如下: ????????? ? ? ? ? ? ? ? ? ?? ? ? ? ? ? ? ? 显示查询使用了何种类型,从最好到最差依次是: ??????????????system>const>eq_ref>ref>range>index>ALL
????????????????????????备注:一般来说,得保证查询至少达到range级别,最好能达到ref。? ? ? ? ? ? 5)possible_keys????????????????显示可能应用这张表中的索引,一个或多个。 ? ? ? ? ? ?6)key???????????????实际使用的索引。如果为NULL,则没有使用索引。 ???????????????查询中若使用了覆盖索引,则该索引仅出现在key列表中。 ? ? ? ? ?7)key_len????????????????表示索引中使用的字节数,可通过该列计算查询中使用的索引的长度。在不损失精确性的情况下,长度越短越好; ????????????????key_len显示的值为索引字段的最大可能长度,并非实际使用长度,即key_len是根据表定义计算而得,不是通过表内检索出的。 ? ? ? ? ?8)ref????????????????显示索引的哪一列被使用了,如果可能的话,是一个常数。哪些列或常量被用于查找索引列上的值 ? ? ? ? ?9)rows????????????????根据表统计信息及索引选用情况,大致估算出找到所需的记录所需要读取的行数。 ? ? ? ? ?10)Extra?????????????????包含不适合在其他列中显示但十分重要的额外信息。注:下图中的展示方式是因为" \G "改变了展示方式。
? ? ? ? ? ? ? ? ?覆盖索引(Covering Index): ?五、?<索引优化>? ? ? ? ?索引失效(应该避免)? ? ? ? ? ? ? ? 1.全值匹配我最爱 ? ? ? ? ? ? ? ? 2.最佳最前缀法则:如果索引了多列,要遵守最左前缀法则。指的是查询从索引的最左前列开始并且不跳索引中的列。 ? ? ? ? ? ? ? ? 3.不在索引列上做任何操作(计算、函数、(自动or手动)类型转换),会导致索引失效而转向全表扫描 ? ? ? ? ? ? ? ? 4.存储引擎不能使用索引中范围条件右边的列 ? ? ? ? ? ? ? ? 5.尽量使用覆盖索引(只访问索引的查询(索引列和查询一致)),减少select* ? ? ? ? ? ? ? ? 6.mysql在使用不等于(!=或者<>)的时候无法使用索引会导致全表扫描 ? ? ? ? ? ? ? ? 7.is null,is not null也无法使用索引 ? ? ? ? ? ? ? ? 8.like以通配符开头('%abc...')mysql索引失效会变成全表扫描的操作 ? ? ? ? ? ? ? ? 9.字符串不加单引号索引失效 ? ? ? ? ? ? ? ? 10.少用or,用它来连接时会索引失效 ? ? ? ? ?优化总结口诀: ? ? ? ? ? ? ? ? 全值匹配我最爱,最左前缀要遵守; ? ? ? ? ? ? ? ? 带头大哥不能死,中间兄弟不能断; ? ? ? ? ? ? ? ? 索引列上少计算,范围之后全失效; ? ? ? ? ? ? ? ? LIKE百分写最右,覆盖索引不写星(*)。 ? ? ? ? 一般性建议? ? ? ? ? ? ? ? 1.对于单键索引,尽量选择针对当前query过滤性更好的索引 ? ? ? ? ? ? ? ? 2.在选择组合索引的时候,当前query中过滤最好的字段在索引字段顺序中,位置越靠前越好。 ? ? ? ? ? ? ? ? 3.在选择组合索引的时候,尽量选择可以能够包含当前query中的where字句中更多字段的索引 ? ? ? ? ? ? ? ? 4.尽可能通过分析统计信息和调整query的写法来达到选择合适索引的目的 ? ? 作者:筱白爱学习!! 欢迎关注转发评论点赞沟通,您的支持是筱白的动力! ? |
|
|
上一篇文章 下一篇文章 查看所有文章 |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
360图书馆 购物 三丰科技 阅读网 日历 万年历 2025年1日历 | -2025/1/18 14:36:24- |
|
网站联系: qq:121756557 email:121756557@qq.com IT数码 |