SQL Server删除重复数据只保留一条

介绍

最近在导入数据库数据, 有时候给的数据源文件,存在重复数据, 需要清除但是还需要保留一条记录的需求.

本文将介绍如何使用SQL Server来实现这个需求。

流程

下面是实现删除重复数据的流程,我们可以用表格展示每个步骤:

步骤 描述

步骤一 先看看有哪些重复的数据

步骤二 根据条件删除重复数据

SQL实现

步骤一:先看看有哪些重复的数据(根据条件分组)

首先,我们需要查询出所有重复数据,以便后续删除操作。以下是查询重复数据的代码:

sql 复制代码
SELECT col1, col2,  COUNT(*) AS count
FROM table_name
GROUP BY col1, col2
HAVING COUNT(*) > 1;

这段代码将会返回具有重复值的记录,并且还会显示重复次数。需要根据实际情况将 table_name 替换为你所使用的表名,col1, col2 替换为需要判断重复的列。

步骤二:根据条件删除重复数据

在查询出所有重复数据后,我们可以根据条件删除这些重复数据,只保留一条。以下是删除重复数据的代码:

sql 复制代码
WITH cte AS (
    SELECT col1, col2 ROW_NUMBER() OVER(PARTITION BY col1, col2  ORDER BY (SELECT 0)) AS rn
    FROM talbe_name
)
DELETE FROM cte
WHERE rn > 1;

这段代码使用了 ROW_NUMBER() 函数和一个公共表表达式(Common Table Expression,CTE)来为每条记录分配一个行号,并按照指定的列进行分组。最后,我们删除行号大于1的记录,即保留第一条记录,删除重复数据。

需要注意的是,同样需要根据实际情况将 table_name 替换为你所使用的表名,col1, col2 替换为需要判断重复的列。

相关推荐
kura_tsuki32 分钟前
[Oracle数据库] Oracle 常用函数
数据库·oracle
YA3332 小时前
java基础(十)sql的mvcc
数据库
Wy_编程3 小时前
Linux文件相关命令
linux·运维
Viking_bird3 小时前
centos 7.5 + Hadoop 3.2.4 集群搭建
linux·运维·服务器·hadoop·centos
黑客影儿4 小时前
Kali Linux 环境中的系统配置文件与用户配置文件大全
linux·运维·程序人生·安全·网络安全·系统安全·学习方法
岚天start4 小时前
Linux系统网络排查工具总结
linux·运维·网络·监控·扫描·连通性·流量
weixin_307779135 小时前
VS Code配置MinGW64编译SQLite3库
开发语言·数据库·c++·vscode·算法
SelectDB6 小时前
Apache Doris 4.0 AI 能力揭秘(一):AI 函数之 LLM 函数介绍
数据库·人工智能·数据分析
我是哈哈hh6 小时前
【MySQL】在UBuntu环境安装以及免密码登录入门
linux·数据库·mysql·ubuntu
Lovyk6 小时前
基于 Ansible 与 Jinja2 模板的 LNMP 环境及 WordPress 自动化部署实践
linux·运维·服务器·自动化·ansible