前言
最近看到一篇关于COUNT查询效率的博客,主要就是探究COUNT(*)、COUNT(1)、COUNT(主键)、COUNT(字段)之间哪个查询效率更高一些。 刚好手里有一个1200W测试数据的表,本着好奇的心态,我们也试一试不同COUNT方式之间有多大的差异。 注意:以下测试均在MySQL8.0.27下的InnoDB中进行,且在本机进行查询测试,避免网络延迟对查询快慢造成影响。
测试
COUNT(*)
data:image/s3,"s3://crabby-images/e68d5/e68d51e87930cfff381c70227b21db05a9999a26" alt="在这里插入图片描述" 三次查询结果分别是:6.99s、6.96s、6.97s。
COUNT(1)
data:image/s3,"s3://crabby-images/f83a2/f83a2d511bd0116e0159401ec6a3e2b5f484b69f" alt="在这里插入图片描述" 三次查询结果分别是:6.95s、6.97s、6.97s。
COUNT(主键)
data:image/s3,"s3://crabby-images/a2e73/a2e7340e9fad81decefc79b4a5e72b0621627818" alt="在这里插入图片描述" 三次查询结果分别是:6.95s、6.96s、6.99s。
COUNT(有索引且非NULL字段)
data:image/s3,"s3://crabby-images/d4c2e/d4c2e45e6485d61de256c5d851b1bc6c895882e3" alt="在这里插入图片描述" 三次查询结果分别是:6.97s、7.00s、6.96s。
COUNT(无索引且非NULL字段)
data:image/s3,"s3://crabby-images/898e6/898e6ae5097181bc6bcbb9228196184321d3def7" alt="在这里插入图片描述" 三次查询结果分别是:6.97s、6.98s、6.97s。
结果分析
单看查询时长,这几种COUNT方式之间并没有拉开差距,所以我们结合EXPLAIN语句,分析一下原因。 各SQL语句的执行计划结果如下: data:image/s3,"s3://crabby-images/3ffdd/3ffdd8c3ad918282705078ff4add6bb7973a48b3" alt="在这里插入图片描述" data:image/s3,"s3://crabby-images/45d66/45d6600d1c40c1f6dc5e1c7fefbc64ada285f5f7" alt="在这里插入图片描述" data:image/s3,"s3://crabby-images/c5e01/c5e013b74e764f208649c77d7a7aa3ef6414cdd6" alt="在这里插入图片描述" data:image/s3,"s3://crabby-images/8bfea/8bfea77b2478e7f468a90264cb40374506bfecbf" alt="在这里插入图片描述" data:image/s3,"s3://crabby-images/86a05/86a052b92a418a954e9b3214b8380823197fb61b" alt="在这里插入图片描述" COUNT(mobile)使用mobile字段索引,COUNT(name)全表扫描,这都可以理解。 没想到的是,COUNT(*)、COUNT(1)、COUNT(id)这三个查询都是用的mobile字段的索引。 即使我使用“FORCE INDEX(PRIMARY)”来强制使用主键索引,也没能改变最终的查询时长。 注意:这里没有尝试COUNT(可为NULL字段)的查询例子,因为COUNT(字段)只会记录非NULL的数据量,会影响我们的对比测试结果。
不严谨的结论
关于COUNT(*)和COUNT(1)的区别, MySQL官方文档已经给出了解释。没有区别。
InnoDB handles SELECT COUNT(*) and SELECT COUNT(1) operations in the same way. There is no performance difference.
关于COUNT(字段)和COUNT(*)的区别,就是COUNT(*)返回检索到的行数的计数,无论是否包含 NULL 值。而COUNT(字段)返回目标字段中,非NULL值的计数。 至于数据扫描逻辑,这里引用官方的解释:
InnoDB processes SELECT COUNT(*) statements by traversing the smallest available secondary index unless an index or optimizer hint directs the optimizer to use a different index. If a secondary index is not present, InnoDB processes SELECT COUNT(*) statements by scanning the clustered index. InnoDB 通过遍历最小的可用二级索引来处理 SELECT COUNT(*) 语句,除非索引或优化器提示指示优化器使用不同的索引。如果二级索引不存在,InnoDB 通过扫描聚集索引来处理 SELECT COUNT(*) 语句。
最后,COUNT(*)、COUNT(1)、COUNT(字段)看起来没有本质的区别……
参考文档: https://dev.mysql.com/doc/refman/8.0/en/aggregate-functions.html#function_count
|