IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 大数据 -> 对SQL慢查询的优化(MySQL) -> 正文阅读

[大数据]对SQL慢查询的优化(MySQL)

一、慢查询原因

要对慢查询进行优化,首先要搞清楚慢查询的原因,原因主要有三:

(1)加载了不需要的数据列

(2)查询条件没有命中索引

(3)数据量太大

二、优化方案

优化也是针对这三个方向的:

(1)先分析语句,看看是否加载了额外的数据,可能是查询了多余的行并且抛弃掉了,可能是加载了许多结果中并不需要的列,如果有这些问题,则对语句进行分析、重写

(2)分析语句的执行计划,获得其使用索引的情况,然后修改语句或修改索引,使得语句尽可能地命中索引

(3)如果对语句的优化都已经无法进行了,可以考虑是否是表中数据量太大引起的慢查询,如果是,则可以进行横向或者纵向分表

三、补充-执行计划

1、MySQL的执行计划怎么看

(1)最简单的做法是,使用可视化工具Navicat,执行查询时打开【解释】

(2)具体的含义

?

执行计划字段对照表
序号字段作用
1id

id是一个有顺序的编号,是查询的顺序号

(1)id的顺序按select出现的顺序增长,有几个select就显示几行,就有几个id。

(2)id列的值越大执行的优先级越高越先执行,id列的值相同则从上往下执行,id列的值为NULL最后执行?

2select_type

表示查询中每个select子句的类型

(1)SIMPLE: 表示此查询不包含 UNION 查询或子查询
(2)PRIMARY: 表示此查询是最外层的查询(包含子查询)
(3)SUBQUERY: 子查询中的第一个 SELECT
(4)UNION: 表示此查询是 UNION 的第二或随后的查询
(5)DEPENDENT UNION: UNION 中的第二个或后面的查询语句,取决于外面的查询
(6)UNION RESULT,UNION 的结果
(7)DEPENDENT SUBQUERY:子查询中的第一个 SELECT,取决于外面的查询. 即子查询依赖于外层查询的结果
(8)DERIVED:衍生,表示导出表的SELECT(FROM子句的子查询)
3table表示该语句查询的表
4partitions
5type

是优化SQL的重要字段,判断SQL性能和优化程度的重要指标。

type的取值类型范围:

(1)const:通过索引一次命中,匹配一行数据

(2)system:表中只有一行记录,相当于系统表

(3)eq_ref:唯一性索引扫描,对于每个索引键,表中只有一条记录与之匹配

(4)ref:非唯一性索引扫描,返回匹配某个值的所有

(5)range:只检索给定范围的行,使用一个索引来选择行,一般用于:between,<,>

(6)index:只遍历索引树

(7)ALL:表示全表扫描,这个类型的查询是性能最差的查询之一。随着表的数量增多,执行效率变慢

*(8)执行效率:
ALL < index < range< ref < eq_ref < const < system。最好是避免ALL和index

6possible_keys表示Mysql在执行该sql语句的时候,可能用到的索引信息,仅仅是可能,实际不一会用到。很多时候索引不一定会命中。
7key此字段是 mysql 在当前查询时所真正使用到的索引。?key是possible_keys的子集
8key_len表示查询优化器使用了索引的字节数,这个字段可以评估组合索引是否完全被使用,这也是我们优化sql时,评估索引的重要指标。
9ref
10rowsmysql 查询优化器根据统计信息,估算该sql返回结果集需要扫描读取的行数,这个值相关重要,索引优化之后,扫描读取的行数越多,说明索引设置不对,或者字段传入的类型之类的问题,说明要优化空间越大
11filtered返回结果的行占需要读到的行(rows列的值)的百分比,就是百分比越高,说明需要查询到数据越准确, 百分比越小,说明查询到的数据量大,而结果集
12extra(1)using filesort :表示 mysql 对结果集进行外部排序,不能通过索引顺序达到排序效果。一般有using filesort都建议优化去掉,因为这样的查询 cpu 资源消耗大,延时大。
(2)using index:覆盖索引扫描,表示查询在索引树中就可查找所需数据,不用扫描表数据文件,往往说明性能不错。
(3)using temporary:查询有使用临时表, 一般出现于排序, 分组和多表 join 的情况, 查询效率不高,建议优化。
(4)using where :sql使用了where过滤,效率较高。

对1的一个例子:有多少个select就有多少行,就有多少id

注:执行计划就是SQL的执行查询的顺序。

2、SQL语句的执行顺序

SQL语句的执行顺序是区别于,SQL的执行查询的顺序的,这感觉有点咬字眼了。

但是一般说的SQL语句的执行顺序是指:

SELECT * FROM `student`?这么一个select查询语句的执行顺序,这里是先from然后才是select。

如果有where等其他关键字:

select 语句的执行顺序

1from
2join
3on
4where
5group by
6count、sum等统计函数
7having
8select
9distinct
10order by
11limit



?

?3、关于索引没有命中的一种猜想

如果创建了索引,特别是组合索引,却没有命中,那么优先要考虑创建的索引有没有符合最左前缀原则。

(1)最左前缀原则:顾名思义是最左优先,以最左边的为起点任何连续的索引都能匹配上。

????????1)如果第一个字段是范围查询需要单独建一个索引;

????????2)在创建多列索引时,要根据业务需求,where子句中使用最频繁的一列放在最左边;

当创建(a,b,c)复合索引时,想要索引生效的话,只能使用 a和ab、ac和abc三种组合。

(2)一个例子:

为student表创建一个组合索引 age_name_sex_index

?在执行计划中可以看到,索引命中了,这时where 了?age字段

?但是如果没有where了age字段,那么索引就不会命中

  大数据 最新文章
实现Kafka至少消费一次
亚马逊云科技:还在苦于ETL?Zero ETL的时代
初探MapReduce
【SpringBoot框架篇】32.基于注解+redis实现
Elasticsearch:如何减少 Elasticsearch 集
Go redis操作
Redis面试题
专题五 Redis高并发场景
基于GBase8s和Calcite的多数据源查询
Redis——底层数据结构原理
上一篇文章      下一篇文章      查看所有文章
加:2022-04-15 00:05:37  更:2022-04-15 00:12:34 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2025年1日历 -2025/1/16 12:42:06-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码