还在用 COUNT(*)
判断数据存不存在?学会这招,性能提升 10 倍!
今天咱们聊一个超实用的话题。
相信很多刚接触数据库的朋友,想要判断某条数据是否存在时,第一反应就是会写出类似下面的 SQL:
sql
SELECT COUNT(*) FROM users WHERE email = 'test@example.com';
然后再在代码里判断,返回的数据结果是不是大于 0。
这样写虽然没有什么错误,可以实现功能,但是,其实并不是最好的方式。
今天,就跟大家聊一聊,一个更优雅、性能更好的方法!
先说说 COUNT(*) 哪里不好
假设你的用户表中有 100 万条数据,你想看看邮箱 zhang@example.com
有没有已经被注册过。
如果你使用 COUNT(*)
的话:
sql
SELECT COUNT(*) FROM users WHERE email = 'zhang@example.com';
数据库就会这样工作:
- 找到第 1 条匹配的记录:"找到了!"
- 继续找第 2 条:"还有吗?"
- 继续找第 3 条:"再找找..."
- 一直找到最后:"总共找到了 1 条"
那么,现在问题就来了:我们只是想知道"有没有",但数据库却要告诉我们"有多少"。然而,我们压根儿就不关心具体的数量有多少,这纯粹就是妥妥的浪费了数据库资源,并且查询的性能极差。
那么,我想知道数据库中有没有这条数据存在,又应该如何操作呢?
正确做法:使用 EXISTS
EXISTS
就是来解决这个痛点的!只要有数据符合查询条件,那么就立即返回,不会进一步查找了。
exists 的基础用法
sql
-- ✅ 推荐写法
SELECT EXISTS (
SELECT 1 FROM users WHERE email = 'test@example.com'
) AS user_exists;
这个查询会返回:
1
(或true
):表示存在0
(或false
):表示不存在
一般情况下,只会返回
1
或者0
能不能返回 boolean 值,取决于你使用的 orm 的封装。
为什么写 SELECT 1
有的童鞋看到了上面的 SQL,就比较好奇了:为什么是 SELECT 1
而不是 SELECT *
呢?
其实在这个场景中,下面的这些写法,效果都是一样的,但 SELECT 1
最简洁。
sql
SELECT EXISTS (SELECT 1 FROM users WHERE email = 'test@example.com');
SELECT EXISTS (SELECT * FROM users WHERE email = 'test@example.com');
SELECT EXISTS (SELECT email FROM users WHERE email = 'test@example.com');
因为 EXISTS
只关心"有没有结果",不关心"具体是什么结果"。所以写 SELECT 1
也可以在代码层面上看起来简洁又高效。
实际应用
场景一:用户注册时检查邮箱
sql
-- 检查邮箱是否已被注册
SELECT EXISTS (
SELECT 1 FROM users
WHERE email = 'newuser@example.com'
) AS email_taken;
-- 返回 1 表示已被占用,0 表示可以使用
场景二:查询有订单的用户
sql
-- 找出所有有过订单的用户
SELECT u.id, u.name, u.email
FROM users u
WHERE EXISTS (
SELECT 1 FROM orders o
WHERE o.user_id = u.id
);
这个查询的意思是:对于每个用户,检查订单表里是否存在该用户的订单记录。
场景三:查询没有订单的用户
sql
-- 找出从来没下过单的用户
SELECT u.id, u.name, u.email
FROM users u
WHERE NOT EXISTS (
SELECT 1 FROM orders o
WHERE o.user_id = u.id
);
NOT EXISTS
就是"不存在"的意思。
性能对比
我们用一个真实例子来看看性能差异:
sql
-- 假设用户表中有 50 万条记录
-- 使用 COUNT(*) 的方式
SELECT COUNT(*) FROM users WHERE city = '上海';
-- 执行时间:150ms(需要统计所有上海的用户)
-- 使用 EXISTS 方式
SELECT EXISTS (
SELECT 1 FROM users WHERE city = '上海'
) AS has_sh_users;
-- 执行时间:3ms(找到第一个就直接停止了)
性能直接提升了 50 倍! 不过具体的执行时间,也取决于硬件设备的情况。
为什么这么快?因为 EXISTS
找到第一条符合条件的记录就立刻返回 true
,不会继续往下找了。
在 Go 中怎么用?
假设我们用 Go + MySQL 开发一个用户系统:
基础用法
go
package main
import (
"database/sql"
"fmt"
"log"
_ "github.com/go-sql-driver/mysql"
)
// 检查邮箱是否已存在
func CheckEmailExists(db *sql.DB, email string) (bool, error) {
var exists bool
query := `
SELECT EXISTS (
SELECT 1 FROM users
WHERE email = ?
)`
err := db.QueryRow(query, email).Scan(&exists)
if err != nil {
return false, err
}
return exists, nil
}
func main() {
// 连接数据库
db, err := sql.Open("mysql", "user:password@tcp(localhost:3306)/mydb")
if err != nil {
log.Fatal(err)
}
defer db.Close()
// 检查邮箱是否存在
email := "test@example.com"
exists, err := CheckEmailExists(db, email)
if err != nil {
log.Fatal(err)
}
if exists {
fmt.Printf("邮箱 %s 已被注册\n", email)
} else {
fmt.Printf("邮箱 %s 可以使用\n", email)
}
}
实际业务场景
go
// 用户注册逻辑
func RegisterUser(db *sql.DB, email, password string) error {
// 1. 先检查邮箱是否已存在
exists, err := CheckEmailExists(db, email)
if err != nil {
return fmt.Errorf("检查邮箱失败: %v", err)
}
if exists {
return fmt.Errorf("邮箱 %s 已被注册", email)
}
// 2. 邮箱可用,执行注册逻辑
_, err = db.Exec(`
INSERT INTO users (email, password, created_at)
VALUES (?, ?, NOW())
`, email, password)
if err != nil {
return fmt.Errorf("注册失败: %v", err)
}
fmt.Printf("用户 %s 注册成功!\n", email)
return nil
}
// 检查用户是否有订单
func UserHasOrders(db *sql.DB, userID int) (bool, error) {
var hasOrders bool
query := `
SELECT EXISTS (
SELECT 1 FROM orders
WHERE user_id = ? AND status != 'cancelled'
)`
err := db.QueryRow(query, userID).Scan(&hasOrders)
return hasOrders, err
}
// 获取用户信息,同时检查是否为 VIP
func GetUserWithVIPStatus(db *sql.DB, userID int) error {
type UserInfo struct {
ID int `json:"id"`
Name string `json:"name"`
Email string `json:"email"`
IsVIP bool `json:"is_vip"`
}
var user UserInfo
query := `
SELECT
u.id,
u.name,
u.email,
EXISTS (
SELECT 1 FROM memberships m
WHERE m.user_id = u.id
AND m.status = 'active'
AND m.expired_at > NOW()
) AS is_vip
FROM users u
WHERE u.id = ?`
err := db.QueryRow(query, userID).Scan(
&user.ID, &user.Name, &user.Email, &user.IsVIP,
)
if err != nil {
return err
}
fmt.Printf("用户信息: %+v\n", user)
return nil
}
几个建议点
1. 记得建索引
sql
-- 为了让 EXISTS 查询更快,记得在经常查询的字段上建索引
CREATE INDEX idx_users_email ON users(email);
CREATE INDEX idx_orders_user_id ON orders(user_id);
2. 处理 NULL 值
sql
-- 如果字段可能为 NULL,记得特殊处理
SELECT EXISTS (
SELECT 1 FROM users
WHERE phone IS NOT NULL
AND phone = '13800138000'
) AS phone_exists;
3. 不要在 EXISTS 里写 ORDER BY
sql
-- 没必要排序
SELECT EXISTS (
SELECT 1 FROM users
WHERE city = '上海'
ORDER BY created_at -- 这个排序完全没啥卵用
);
-- 直接开撸
SELECT EXISTS (
SELECT 1 FROM users
WHERE city = '上海'
);
最后
现在,当你想要去查询数据是否存在的时候,知道应该用哪个了吧?
- 数据有没有,存不存在,直接用
exists
- 要是必须知道数量有多少,那么才用
count
如果这篇文章对你有所帮助,还望帮忙点个赞支持一下哈~