本日我们就来聊一聊,count()是如何统计一张表中的总行数的,以及count()、count(1)、count(id)、count(字段)这几种办法的性能差异。
count()的实行办法首先,根据官方的描述,利用不同的实行引擎,count()的实现办法是有差异的。
在MyISAM引擎中,表的总行数是直接存在磁盘上,以是查询的时候可以直接返回,效率很高。

但是对付InnoDB引擎来说,情形就不一样了。由于多版本并发掌握MVCC的存在,InnoDB在实行count()时,无法确定表中到底有多少行,只好把数据一行一行的从引擎中读出来,然后累加计数。
那InnoDB为什么要这么麻烦呢?为什么不像MyISAM那样,把总行数存在磁盘上呢?
这是由于在同一时候,可能存在多个事务查询,由于MVCC的缘故原由,不同事务是相互隔离的,InnoDB须要在当前事务中,一行一行的读取数据,然后判断哪些数据对自己是可见的,哪些数据对自己是不可见的。
以是随着表中数据越来越多,我们会创造count()的速率也会越来越慢了。
不同count用法的差异首先我们要清楚,count是一个聚合函数,对查到的结果集,会一行一行的判断,如果不为NULL,累计值就加1,终极得到一个值。
1,对付count(主键id)来说,InnoDB引擎遍历表中的每一行,将主键id获取到往后返回给Server层,Server层判断id不为null,然后进行累加。(ps.主键id肯定是不为空的,正常来说是不须要判断的,但是官方源码中确实有这个判断)
2,对付count(1)来说,InnoDB依然遍历表中的每一行,但是并不获取值(返回一行,不取字段),Server对付返回的数据,直接放一个“1”进去,然后判断不为null,进行累加。
3,对付count(字段)来说,遍历表中的每一行,读出这个字段,Server层判断是否为null,如果不为null,则进行累加,如果为null,就忽略这一行。
4,对付count()来说,MySQL专门做了优化,就像count(1)那样,并不取值,count()肯定不是null,直接按行累加。
由于count()并不须要对获取的值进行null判断,以是性能理论上会比count(1)更好一点。但是一样平常认为这点影响微乎其微,并没有什么实际性差异。
这一点在MySQL官方文档上也有解释:
InnoDB handles SELECT COUNT() and SELECT COUNT(1) operations in the same way. There is no performance difference。
总结按照实行效率来说:count(字段)<count(主键id)<count(1)≈count()。
一样平常情形下,count()是更好的选择。
写文不易,朋友们点赞关注支持一下吧。