IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 大数据 -> 一次mysql联表 join 后 order by desc 慢的排查 -> 正文阅读

[大数据]一次mysql联表 join 后 order by desc 慢的排查

一、前言

因为项目需要进行数据量测试,查看项目相关指标在预期数量中是否正常,所以,其中一项就是数据库的数据量测试,发现项目在查询的时候非常的慢。

二、问题概述

1、一张用户表 sys_user_info,和问题相关的字段,主要有以下数据,因为用户表很少,目前为8条,所以,暂时未加索引。

字段说明
id主键
dept_id所属部门

在这里插入图片描述

2、一张工单表 work_order,和问题相关的字段和索引,主要有以下数据 ,其中数据为 290万条数据

字段说明
id主键
create_user_id工单创建人id,就是用户id
create_time创建时间
索引说明
idx_create_user_id主键
idx_create_time工单创建人id,就是用户id

在这里插入图片描述

3、现在的需求是不同用户只能看指定部门下人员的工单,而且前端在查询的时候,是有用户名称之类的查询条件的,所以,初步sql 如下

WITH sui AS ( SELECT id, dept_id, `name` FROM sys_user_info WHERE dept_id IN ( 用户可以看那些部门的id ) ) 


SELECT
	wo.*,
	( SELECT `name` FROM sys_user_info sui_1 WHERE sui_1.id = wo.create_user_id ) AS createUserName,
	sui.`name` AS dealUserName 
FROM
	work_order wo
	INNER JOIN sui ON wo.deal_user_id = sui.id 
ORDER BY
	wo.create_time DESC 
	WHERE ......条件
	LIMIT 0,20

三、问题

1、我们执行以下一个简单的查询,在数据量少的时候,发现没有什么问题,但是在工单表290万数据之后就出现问题了,查询耗时近9秒,实在是离谱。

WITH sui AS ( SELECT id, dept_id, `name` FROM sys_user_info WHERE dept_id IN ( ( 3 ), ( 6 ), ( 7 ) ) ) 

SELECT
	wo.*,
	( SELECT `name` FROM sys_user_info sui_1 WHERE sui_1.id = wo.create_user_id ) AS createUserName,
	sui.`name` AS dealUserName 
FROM
	work_order wo
	INNER JOIN sui ON wo.deal_user_id = sui.id 
ORDER BY
	wo.create_time DESC 
	LIMIT 0,20

在这里插入图片描述

2、经过我慢慢排查发现,就是一旦我们不使用时间排序,就会发现快的起飞(当然这也是我在关键字段上加上索引的缘故,后面我会统一说
在这里插入图片描述

四、方案

4.1、处理

1、第一步使用 explain show profiles 来查看自己的sql有没有问题,看看是不是自己预期的情况,是不是 innodb_buffer_pool_size大小的问题。可以看下这个 一次mysql order by desc 慢的排查,个人觉得是比较好的。但是,我这边这个值已经是 1G了,但是效果还是很不理想,所以我暂时排除了这个方案。
在这里插入图片描述

2、我使用 explain命令查看后,可以看到我们在使用时间字段排序的时候,rows是293万行?这就是很离谱了,这就说明为什么那么慢了,而且看到最后一行 filesort就知道,我们该优化这个Sql了。

这个为什么是293万,为什么会比工单表290万还大,那是因为我们使用join关联表,形成了笛卡儿积。所以,我们最好能把先过滤的表的数据形成一张子表后,再关联。

在这里插入图片描述

3、我们在注释时间排序后,发现只有50万左右的数据了,一下少了近 1/4。
在这里插入图片描述
4、所以我们得出,我们必须先让时间索引生效,在这里网上有一些不同的方式,如下

  • 使用关键字 straight_join 修改驱动表和被驱动表的位置 ,可以参考 MySQL中驱动表和被驱动表的解读,但是我个人是不建议改的,而且改完MySQL就不能根据实际情况更改了。
  • 使用 FORCE INDEX(索引名称) 来强制使用索引。

5、我这里就已第二种方式来处理,可以看到使用的日期索引,并且个数是19(从0开始)
在这里插入图片描述
6、再看下查询速度,还是很快的。
在这里插入图片描述

4.2、问题的原因

1、所以总结在使用 ORDER BY wo.create_time DESC 慢的原因

  • 如果我们不使用字段排序,那么使用inner join后 只需要获取第0页20条数据即可,也就是在189514条数据中找前面20条即可,所以会快很多。
  • 但如果我们使用时间字段排序,这个时候我们需要对inner join的结果进行排序,而排序字段索引又没有生效(使用的是filesort),所以就很慢了。
  • 至于排序字段的索引为什么不生效,我们先看下 为什么MySQL会使用 filesort,官方解释如下:

Using filesort:
MySQL must do an extra pass to find out how to retrieve the rows in sorted order. The sort is done by going through all rows according to the join type and storing the sort key and pointer to the row for all rows that match the WHERE clause.
Mysql需要额外的一次传递,以找出如何按排序顺序检索行,通过根据联接类型浏览所有行并为所有匹配where子句的行保存排序关键字和行的指针来完成排序,然后关键字被排序,并按排序顺序检索行。

这句话直接翻译过来有点难以理解,简单说就是由于索引不满足你的sql,mysql需要对数据行进行一次额外的排序操作,这个排序操作既费空间又费时间。当数据量较少的时候并不会对应用产生多大影响,但数据量一多,就会出现非常可怕的后果,轻则服务响应变慢,重则拖垮服务,甚至引发雪崩效应导致应用宕机。

再回来看看我的sql,查询列和搜索条件应该都没有问题,那么应该order by影响了。通过搜索发现,order by 使用不当确实会导致索引失效。

五、使用 order by后查询速度很慢的可能原因。

  • 由于数据库两张表的字段编码不一致导致的。
  • 由于Using filesort排序导致的。
  • 由于没有走索引导致的。
  • 使用组合索引排序时,使用的顺序不对,需要保证顺序。

这里说一点,我们在联表查询的时候,最好相关外键都加上索引,这样会快很多。

  大数据 最新文章
实现Kafka至少消费一次
亚马逊云科技:还在苦于ETL?Zero ETL的时代
初探MapReduce
【SpringBoot框架篇】32.基于注解+redis实现
Elasticsearch:如何减少 Elasticsearch 集
Go redis操作
Redis面试题
专题五 Redis高并发场景
基于GBase8s和Calcite的多数据源查询
Redis——底层数据结构原理
上一篇文章      下一篇文章      查看所有文章
加:2022-05-16 11:21:36  更:2022-05-16 11:22:59 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 -2024/11/28 3:37:32-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码