[小技巧70]深入COUNT(*)、COUNT(1) 与 COUNT(字段)：你以为的快，其实慢了

一、语义层面的根本差异

表达式	语义说明
`COUNT(*)`	统计结果集中所有行的数量，包括 NULL 值和重复行。这是 SQL 标准定义的"行计数"操作。
`COUNT(1)`	与 `COUNT()` 语义等价* 。`1` 是一个常量表达式，永不为 NULL，因此每行都被计入。
`COUNT(字段)`	仅统计指定字段非 NULL 值的行数。若字段值为 `NULL`，该行不计入结果。

关键结论 ：COUNT(*) 与 COUNT(1) 在语义和结果上完全一致；COUNT(字段) 则受 NULL 值影响，结果可能更小。

MySQL 优化器对 COUNT(*) 和 COUNT(1) 进行了特殊处理：

InnoDB 引擎：
- 由于 InnoDB 不维护表的精确行数（因 MVCC 机制），COUNT(*) 必须扫描聚簇索引（主键索引）或最小二级索引来统计行数。
- 优化器会自动将 COUNT(1) 重写为 COUNT(*)，二者生成完全相同的执行计划。
- 对于 COUNT(字段)，若该字段允许 NULL，则无法使用"跳过 NULL"的优化，必须读取该字段的实际值以判断是否为 NULL。
MyISAM 引擎：
- MyISAM 在表元数据中缓存了总行数，因此 COUNT(*) 可 O(1) 返回结果（无 WHERE 子句时）。
- 但 COUNT(字段) 仍需扫描数据（除非字段为 NOT NULL 且有覆盖索引），因为 NULL 值会影响结果。

维度	`COUNT(*)` / `COUNT(1)`	`COUNT(字段)`
语义	计所有行	仅计非 NULL 行
NULL 处理	忽略（无影响）	跳过 NULL 值
索引利用	可使用任意最小覆盖索引（含主键）	需读取字段值；若字段有索引且为 NOT NULL，可走索引
InnoDB 性能	需全索引扫描（无 WHERE 时）	若字段无索引，需回表；性能通常更差
MyISAM 性能	O(1)（无 WHERE 时）	需扫描（除非字段为 NOT NULL 且有索引）

注意：在 InnoDB 中，即使 COUNT(主键) 也不会比 COUNT(*) 更快 ，因为主键即聚簇索引，扫描成本相同，且 COUNT(*) 已被高度优化。

Q：COUNT(*) 和 COUNT(1) 在 MySQL 中有性能差异吗？
A ：没有。MySQL 优化器将 COUNT(1) 视为 COUNT(*)，生成完全相同的执行计划。
Q：为什么 InnoDB 的 COUNT(*) 比 MyISAM 慢？
A：InnoDB 因 MVCC 无法缓存精确行数，必须扫描索引；MyISAM 在无 WHERE 时直接返回元数据中的行数。
为什么InnoDB 因 MVCC 无法缓存精确行数

在 InnoDB 中，由于支持 MVCC + 事务隔离级别（如 REPEATABLE READ） ：
不同事务在同一时刻可能看到不同数量的行！

举个例子：

假设有表 orders，当前物理存储了 1000 行。

事务 A 在时间 T1 开始（REPEATABLE READ 隔离级别）。
事务 B 在 T2 删除了 10 行，并提交。
此时：
- 新开启的事务 C 会看到 990 行。
- 但事务 A 仍处于 T1 的快照中，它看到的仍是 1000 行（因为它看不到 T2 之后的修改）。

问题来了：InnoDB 应该把"总行数"记作 1000 还是 990？

答案是：没有唯一的"总行数" 。行数取决于查询所处的事务上下文和一致性视图（Read View）。

InnoDB 的实现机制：没有"全局行数"概念

InnoDB 的设计哲学是：

"数据可见性由事务的 Read View 动态决定，而非预计算。"

每一行都有隐藏的 DB_TRX_ID（插入/更新事务 ID）和 DB_ROLL_PTR（回滚指针）。
当执行 SELECT COUNT(*) 时，InnoDB 必须：
1. 选择一个索引（通常是聚簇索引或最小二级索引）；
2. 逐行遍历；
3. 对每一行，根据当前事务的 Read View 判断该行是否对当前事务可见；
4. 仅对可见的行计数。

这个过程无法跳过，因为可见性无法预先聚合------它依赖于运行时的事务状态。

Q：COUNT(字段) 返回 0，是否说明表为空？
A ：不一定。可能所有行的该字段值均为 NULL。
Q：如何高效获取大表的近似行数？
A ：可查询 information_schema.TABLES.TABLE_ROWS（注意：InnoDB 下为估算值），或使用采样统计。
Q：COUNT(主键) 是否比 COUNT(*) 更快？
A ：否。InnoDB 中主键即聚簇索引，COUNT(*) 已优化为使用最小索引，二者成本相同。