SQL Server删除重复数据只保留一条

介绍

最近在导入数据库数据, 有时候给的数据源文件,存在重复数据, 需要清除但是还需要保留一条记录的需求.

本文将介绍如何使用SQL Server来实现这个需求。

流程

下面是实现删除重复数据的流程,我们可以用表格展示每个步骤:

步骤 描述

步骤一 先看看有哪些重复的数据

步骤二 根据条件删除重复数据

SQL实现

步骤一:先看看有哪些重复的数据(根据条件分组)

首先,我们需要查询出所有重复数据,以便后续删除操作。以下是查询重复数据的代码:

sql 复制代码
SELECT col1, col2,  COUNT(*) AS count
FROM table_name
GROUP BY col1, col2
HAVING COUNT(*) > 1;

这段代码将会返回具有重复值的记录,并且还会显示重复次数。需要根据实际情况将 table_name 替换为你所使用的表名,col1, col2 替换为需要判断重复的列。

步骤二:根据条件删除重复数据

在查询出所有重复数据后,我们可以根据条件删除这些重复数据,只保留一条。以下是删除重复数据的代码:

sql 复制代码
WITH cte AS (
    SELECT col1, col2 ROW_NUMBER() OVER(PARTITION BY col1, col2  ORDER BY (SELECT 0)) AS rn
    FROM talbe_name
)
DELETE FROM cte
WHERE rn > 1;

这段代码使用了 ROW_NUMBER() 函数和一个公共表表达式(Common Table Expression,CTE)来为每条记录分配一个行号,并按照指定的列进行分组。最后,我们删除行号大于1的记录,即保留第一条记录,删除重复数据。

需要注意的是,同样需要根据实际情况将 table_name 替换为你所使用的表名,col1, col2 替换为需要判断重复的列。

相关推荐
山岚的运维笔记10 小时前
SQL Server笔记 -- 第20章:TRY/CATCH
java·数据库·笔记·sql·microsoft·sqlserver
Gain_chance10 小时前
33-学习笔记尚硅谷数仓搭建-DWS层交易域用户粒度订单表分析及设计代码
数据库·数据仓库·hive·笔记·学习·datagrip
Lsir10110_10 小时前
【Linux】中断 —— 操作系统的运行基石
linux·运维·嵌入式硬件
郝学胜-神的一滴11 小时前
深入浅出:使用Linux系统函数构建高性能TCP服务器
linux·服务器·开发语言·网络·c++·tcp/ip·程序人生
未来之窗软件服务11 小时前
计算机等级考试—高频英语词汇—东方仙盟练气期
数据库·计算机软考·东方仙盟
lekami_兰11 小时前
MySQL 长事务:藏在业务里的性能 “隐形杀手”
数据库·mysql·go·长事务
Doro再努力11 小时前
【Linux操作系统12】Git版本控制与GDB调试:从入门到实践
linux·运维·服务器·git·vim
全栈工程师修炼指南11 小时前
Nginx | stream content 阶段:UDP 协议四层反向代理浅析与实践
运维·网络·网络协议·nginx·udp
JQLvopkk11 小时前
C# 轻量级工业温湿度监控系统(含数据库与源码)
开发语言·数据库·c#
Lsir10110_11 小时前
【Linux】进程信号(上半)
linux·运维·服务器