Mysql--基础知识点--96--count * VS count 列

在 SQL 中，COUNT(*) 和 COUNT(列名) 虽然都用于计数，但语义和性能有明显差异。在需要统计总行数时，应该使用 COUNT(*)，主要原因如下：

sql 复制代码

-- 示例表 t
id | name
1  | 'A'
2  | NULL
3  | 'B'

SELECT COUNT(*) FROM t;   -- 结果：3（所有行）
SELECT COUNT(name) FROM t; -- 结果：2（NULL 行被忽略）

如果错误使用 COUNT(列名) 来统计总行数，当该列存在 NULL 时，结果会变少，导致逻辑错误。

场景	`COUNT(*)`	`COUNT(列名)`
无 WHERE 条件	数据库可以直接从表元数据或索引统计信息中快速返回行数（如 MyISAM 存储了精确行数；InnoDB 会选最小索引扫描）。	必须检查列是否为 `NULL`，通常需要扫描整个表或索引（无法利用元数据缓存）。
有 WHERE 条件	只需要判断行是否满足条件，不关心具体列的值。	不仅要判断条件，还要额外检查该列是否为 `NULL`，增加处理开销。
列允许 `NULL`	无影响。	需要额外的 `NULL` 检查，可能无法利用某些索引优化。
列不允许 `NULL`	同上。	虽然语义上等同于 `COUNT()`，但优化器不一定能自动转换，实际执行计划可能仍不如 `COUNT()` 高效。

结论：COUNT(*) 是专门为统计行数设计的，数据库优化器对其做了大量优化，通常比 COUNT(列名) 更快。

COUNT(*) ：优化器会选择一个最小的二级索引（而不是主键）进行扫描，因为二级索引的叶子节点更小，I/O 更少。如果表有多个索引，它自动选择最轻量的。
COUNT(列名)：如果该列没有索引，必须全表扫描；即使有索引，也只能使用该列上的索引，可能比最小的二级索引更大。

例如 InnoDB 中：

sql 复制代码

-- 假设表有主键 id，二级索引 idx_name
SELECT COUNT(*) FROM t;            -- 使用 idx_name（最小索引）
SELECT COUNT(name) FROM t;         -- 如果 name 有索引则用，否则全表扫描

误用 COUNT(列名) 导致结果错误：上面已经说明。
误用 COUNT(常量)（如 COUNT(1)） ：COUNT(1) 和 COUNT(*) 在语义和性能上完全等价 （因为 1 不是 NULL，不会忽略任何行）。但习惯上推荐 COUNT(*)，更清晰表达"统计行数"。
误用 COUNT(DISTINCT 列名)：那是去重计数，不同需求。

MySQL (InnoDB)：

PostgreSQL：

SQL Server：

最佳实践：