[大数据] Mysql的order by

开发: C++知识库 Java知识库 JavaScript Python PHP知识库人工智能区块链大数据移动开发嵌入式开发工具数据结构与算法开发测试游戏开发网络协议系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑笔记本显卡显示器固态硬盘硬盘耳机手机 iphone vivo oppo 小米华为单反装机图拉丁

-> 大数据 -> Mysql的order by -> 正文阅读

[大数据]Mysql的order by

1.全字段排序

为避免全表扫描，我们需要在city字段加上索引。

select city,name,age from t where city=‘杭州’ order by name limit 1000 ;

Extra这个字段中的“Using filesort”表示的就是需要排序，MySQL会给每个线程分配一块内存用于排序，称为sort_buffer。

通常情况下，这个语句执行流程如下所示：

1.初始化sort_buffer，确定放入name、city、age这三个字段；
2.从索引city找到第一个满足city='杭州’条件的主键id，也就是图中的ID_X；
3.到主键id索引取出整行，取name、city、age三个字段的值，存入sort_buffer中；
4.从索引city取下一个记录的主键id；
5.重复步骤3、4直到city的值不满足查询条件为止，对应的主键id也就是图中的ID_Y；
6.对sort_buffer中的数据按照字段name做快速排序；
7.按照排序结果取前1000行返回给客户端。

按name排序”这个动作，可能在内存中完成，也可能需要使用外部排序，这取决于排序所需的内存和参数sort_buffer_size。

sort_buffer_size，就是MySQL为排序开辟的内存（sort_buffer）的大小。如果要排序的数据量小于sort_buffer_size，排序就在内存中完成。但如果排序数据量太大，内存放不下，则不得不利用磁盘临时文件辅助排序。

内存放不下时，就需要使用外部排序，外部排序一般使用归并排序算法。可以这么简单理解，MySQL将需要排序的数据分成12份，每一份单独排序后存在这些临时文件中。然后把这12个有序文件再合并成一个有序的大文件。

如果sort_buffer_size超过了需要排序的数据量的大小，number_of_tmp_files就是0，表示排序可以直接在内存中完成。

否则就需要放在临时文件中排序。sort_buffer_size越小，需要分成的份数越多，number_of_tmp_files的值就越大。

2.rowid排序

max_length_for_sort_data，是MySQL中专门控制用于排序的行数据的长度的一个参数。它的意思是，如果单行的长度超过这个值，MySQL就认为单行太大，要换一个算法。

新的算法放入sort_buffer的字段，只有要排序的列（即name字段）和主键id。

但这时，排序的结果就因为少了city和age字段的值，不能直接返回了，整个执行流程就变成如下所示的样子：

1.初始化sort_buffer，确定放入两个字段，即name和id；
2.从索引city找到第一个满足city='杭州’条件的主键id，也就是图中的ID_X；
3.到主键id索引取出整行，取name、id这两个字段，存入sort_buffer中；
4.从索引city取下一个记录的主键id；
5.重复步骤3、4直到不满足city='杭州’条件为止，也就是图中的ID_Y；
6.对sort_buffer中的数据按照字段name进行排序；
7.遍历排序结果，取前1000行，并按照id的值回到原表中取出city、name和age三个字段返回给客户端。