数据库优化技巧:MySQL 重复数据查询与删除(仅保留一条)的性能优化策略

目录

一、查询重复数据

二、删除重复数据

[方法 1:创建临时表,操作完成后再删除临时表(安全可靠,适合大表)](#方法 1:创建临时表,操作完成后再删除临时表(安全可靠,适合大表))

[步骤 1:创建临时表存储需删除的 ID](#步骤 1:创建临时表存储需删除的 ID)

[步骤 2:根据临时表删除数据](#步骤 2:根据临时表删除数据)

[方法 2:使用子查询嵌套删除重复记录(简洁高效,适合小表)](#方法 2:使用子查询嵌套删除重复记录(简洁高效,适合小表))


一、查询重复数据

**场景:**按单个字段或多个字段分组,查询重复组中的任意一条记录。

方法: 使用 GROUP BY + MIN()/MAX()

假设表中有主键(如 id),按 name字段查询重复数据,并保留每组中 id 最小的记录:

sql 复制代码
select 
  MIN(id) AS id,  -- 保留最小/最大的主键值
  name
from sys_user
GROUP BY name         -- 按重复字段分组
HAVING COUNT(*) > 1;  -- 筛选出重复组(计数>1)

注意:

  1. 聚合函数选择
    • 使用 MIN(id) 保留最早的记录
    • 使用 MAX(id) 保留最新的记录
  2. SELECT 字段限制
    • 非聚合字段(如name)必须出现在GROUP BY
    • MySQL 5.7+ 默认启用 ONLY_FULL_GROUP_BY 模式,需严格遵守此规则

二、删除重复数据

方法 1:创建临时表,操作完成后再删除临时表**(安全可靠,适合大表)**
步骤 1:创建临时表存储需删除的 ID
sql 复制代码
-- 1、删除临时表(如果存在)
DROP TABLE IF EXISTS temp_sys_user;

-- 2、创建临时表,存储需要删除的重复记录ID
CREATE TABLE temp_sys_user AS (
    SELECT
        a.id
    FROM
        sys_user a
    WHERE
        (
            -- 指定需要去重的字段,可根据实际情况添加更多字段
            a.name
        ) IN (
            SELECT
                c.name
            FROM
                sys_user c
            GROUP BY
                c.name
            HAVING
                COUNT(*) > 1
        )
    AND a.id NOT IN (
        SELECT
            MIN(b.id)
        FROM
            sys_user b
        GROUP BY
            b.username
        HAVING
            COUNT(*) > 1
    )
);
步骤 2:根据临时表删除数据
sql 复制代码
-- 1、根据临时表删除sys_user表中的重复数据
DELETE FROM sys_user WHERE id IN (SELECT id FROM temp_sys_user );

-- 2、删除临时表,释放资源
DROP TABLE IF EXISTS temp_sys_user ;

好处:

  • 避免直接操作原表,减少死锁风险
  • 支持复杂筛选条件
  • 适合处理百万级数据
方法 2:使用子查询嵌套删除重复记录**(简洁高效,适合小表)**
sql 复制代码
DELETE FROM sys_user WHERE id IN (
    SELECT id FROM (
        SELECT id
        FROM sys_user a
        WHERE (
            -- 指定需要去重的字段,保持与方法1一致
            a.name
        ) IN (
            SELECT name
            FROM sys_user
            GROUP BY name
            HAVING COUNT(*) > 1
        )
        AND a.id NOT IN (
            SELECT MIN(id)
            FROM sys_user
            GROUP BY name
            HAVING COUNT(*) > 1
        )
    ) AS temp
);

注意:备份数据!备份数据!备份数据!

(重要的事情说三遍,防止操作失误导致数据丢失)

相关推荐
李广坤16 小时前
MySQL 大表字段变更实践(改名 + 改类型 + 改长度)
数据库
Turnip12022 天前
深度解析:为什么简单的数据库"写操作"会在 MySQL 中卡住?
后端·mysql
爱可生开源社区2 天前
2026 年,优秀的 DBA 需要具备哪些素质?
数据库·人工智能·dba
随逸1772 天前
《从零搭建NestJS项目》
数据库·typescript
加号33 天前
windows系统下mysql多源数据库同步部署
数据库·windows·mysql
シ風箏3 天前
MySQL【部署 04】Docker部署 MySQL8.0.32 版本(网盘镜像及启动命令分享)
数据库·mysql·docker
李慕婉学姐3 天前
Springboot智慧社区系统设计与开发6n99s526(程序+源码+数据库+调试部署+开发环境)带论文文档1万字以上,文末可获取,系统界面在最后面。
数据库·spring boot·后端
百锦再3 天前
Django实现接口token检测的实现方案
数据库·python·django·sqlite·flask·fastapi·pip
WeiXin_DZbishe3 天前
基于django在线音乐数据采集的设计与实现-计算机毕设 附源码 22647
javascript·spring boot·mysql·django·node.js·php·html5
tryCbest3 天前
数据库SQL学习
数据库·sql