那天有个朋友去面试,回来就跟我吐槽:"面试官问了个count
的问题,我直接懵了!" 问题很简单:"count(1)、count(*)
和count(列)
有什么区别?" 我朋友自信满满地回答:"count(1)最快,count(*)最慢,count(列)中等"
结果面试官笑了笑,说了句"再回去研究研究吧" 如果你也是这么想的,那今天这篇文章就是为你写的!
先说结论:别再用count(1)了!
我知道这跟很多人的认知完全相反 但事实就是:在MySQL中,count(*)才是性能最好的!
是的,你没看错 不是count(1)
,而是count(*)
实战见真章:来看测试结果
我在本地建了个测试表,插了100万条数据 然后分别用三种方式count:
sql
-- 创建测试表
CREATE TABLE test_count (
id INT PRIMARY KEY AUTO_INCREMENT,
name VARCHAR(100),
age INT,
is_deleted TINYINT DEFAULT 0
);
-- 插入100万条测试数据
-- 开始测试
SELECT COUNT(*) FROM test_count;
SELECT COUNT(1) FROM test_count;
SELECT COUNT(id) FROM test_count;
SELECT COUNT(name) FROM test_count;
执行时间基本一模一样!
为什么count(*)是性能最好的?
其实在MySQL官方文档里早就说过了: InnoDB引擎会对count(*)
和count(1)
做完全一样的优化
也就是说: count(*)
= count(1)
> count(列)
为什么count(列)
会慢一点?因为count(列)
需要判断这个字段是不是NULL
!不是NULL
才计数,是NULL
就跳过
而count(*)
和count(1)
根本不管这些,直接数行数就完事了。
业务场景中的坑
来看个实际案例: 某天我接到个需求:统计用户表中有效用户数。于是我顺手写了:
sql
SELECT COUNT(is_deleted) FROM users WHERE is_deleted = 0;
结果查询超时了!为什么呢? 因为is_deleted
字段没索引! count(列)
的时候,MySQL
只能全表扫描
但如果改成:
sql
SELECT COUNT(*) FROM users WHERE is_deleted = 0;
虽然还是全表扫描,但至少不用判断每个字段的NULL值了,速度能快那么一丢丢。
优化方案
其实最好的办法是:给筛选条件字段加索引!
sql
ALTER TABLE users ADD INDEX idx_is_deleted (is_deleted);
然后再count
,速度直接起飞!
count(DISTINCT 列)
这时候面试官又问了:"如果我想统计某列有多少个不同的非NULL
值,该用什么?"
正确答案是:count(DISTINCT 列)
sql
-- 统计age有多少个不同的值(跳过NULL)
SELECT count(DISTINCT age) FROM test_count;
总结
- count(*)和count(1)没区别,用哪个都行(但推荐count(*),因为这是SQL标准写法)
- count(列)会慢一点,因为它要排除NULL值
- 最大的性能瓶颈在索引,没索引count啥都慢
下次面试再遇到这个问题,你可以自信地告诉面试官: "count(*)
和count(1)
性能一样,但count(列)
需要额外判断NULL值"。 保证让面试官刮目相看!
希望这篇文章对你有帮助~如果有其他问题,欢迎在评论区留言!
我是大华,专注分享前后端开发的实战笔记。关注我,少走弯路,一起进步!
📌往期精彩
《写给小公司前端的 UI 规范:别让页面丑得自己都看不下去》
《只会写 Mapper 就敢说会 MyBatis?面试官:原理都没懂》
《别再手写判空了!SpringBoot 自带的 20 个高效工具类》