一、知识基础
各类索引:聚簇索引和非聚簇索引
二、底层原理
2.1 Mysql官方文档的解释
总结出来就是:
1)因为并发的原因,Innodb不支持缓存一个count of rows。MyISAM支持缓存一个count of rows
2)InnoDB通过扫描一个索引执行count(*)语句
3)InnoDB对count(*)和count(0)的处理是一致的,没有性能区别
4)可以通过一些手法代替count(*)语句。存一个计数器【不适用高并发】,或者使用【show table status】,该语句查询表的一些常用信息,比如ROWS,该ROWS是不准确的。详见
SHOW TABLE STATUS Statement
2.2 扩展理解
InnoDB通过扫描一个索引执行count(*)语句,MySQL 的?select count(*)?在底层实现统计的过程中通过二级索引优于主键索引优于全表扫描,这是因为二级索引只缓存主键列和索引列,主键索引几乎缓存了所有的行记录,前者势必比后者缓存的内容少的多,当然计算的效率肯定要快的多。
2.3 如何解决这个问题
- 单纯的统计,我们可以考虑用 MyISAM 引擎,它自带计数器,当然了,局限性就不一一列举了,此方案了解即可吧。
- 数据仓库等其他可接入的系统来完成此工作。
- 缓存中间件也不失一个好的建议。
- 做一个类似触发器计数的功能?
- MySQL 8.0 的并行查询,嗯,好功能。
- 历史数据迁移,就不让你查询那么多数据了,这个有点霸道了,可以换着说法,根据业务需求,历史数据迁移,只保留某些数据(按规则)。
- 分库分表,不多说什么,还是物理上的优化。
- 服务器硬件资源提升,比如 SSD 硬盘等(治标不治本)。
- 存一个计数器(不适用高并发)
- 使用show table status(不准确)
参考:12.19.1 Aggregate Function Descriptions
????????? MySQL优化:优化 select count()
三、count(*)、count(1)、count(字段)的区别
执行效果上:??
- count(*)包括了所有的列,相当于行数,在统计结果的时候,不会忽略为NULL的值。??
- count(1)包括了忽略所有列,用1代表代码行,在统计结果的时候,不会忽略为NULL的值。
- count(列名)只包括列名那一列,在统计结果的时候,会忽略列值为空(这里的空不是指空字符串或者0,而是表示null)的计数,即某个字段值为NULL时,不统计。
执行效率上:??
个人感觉主要是索引的方式, 聚簇/非聚簇,是否主键索引都是有影响的。网络上总结的那些不可尽信。?
|