【请关注】mysql一些经常用到的高级SQL

经常去重复数据,数据需要转等操作,汇总高级SQL MySQL操作

一、数据去重(Data Deduplication)

去重常用于清除重复记录,保留唯一数据。

  1. 使用DISTINCT关键字去重单列

-- 从用户表中获取唯一的邮箱地址

SELECT DISTINCT email FROM users;

  1. 使用GROUP BY结合聚合函数去重多列

-- 按姓名和手机号去重,获取最新注册的用户

SELECT name, phone, MAX(register_time) AS latest_time

FROM users

GROUP BY name, phone;

  1. 使用CTE和ROW_NUMBER()窗口函数标记重复行并删除

-- 先标记重复行,再删除非首行记录

WITH DuplicateRows AS (

SELECT id, name, email,

ROW_NUMBER() OVER(PARTITION BY email ORDER BY id) AS row_num

FROM users

)

DELETE FROM DuplicateRows WHERE row_num > 1;

二、数据行转列(Pivot Table)

将行数据转换为列,常用于统计汇总场景。

  1. 使用CASE WHEN手动实现行转列

-- 统计每个用户的不同订单类型数量

SELECT user_id,

SUM(CASE WHEN order_type = '食品' THEN 1 ELSE 0 END) AS food_orders,

SUM(CASE WHEN order_type = '服装' THEN 1 ELSE 0 END) AS clothes_orders,

SUM(CASE WHEN order_type = '数码' THEN 1 ELSE 0 END) AS digital_orders

FROM orders

GROUP BY user_id;

  1. 使用IF函数结合GROUP BY实现动态列

-- 按月份统计销售额(假设月份存于month列)

SELECT product_id,

SUM(IF(month = 1, sales_amount, 0)) AS jan_sales,

SUM(IF(month = 2, sales_amount, 0)) AS feb_sales,

SUM(IF(month = 3, sales_amount, 0)) AS mar_sales

FROM sales

GROUP BY product_id;

  1. 使用动态SQL生成行转列语句(适用于列名不确定的场景)

-- 动态生成SQL(需先查询列名)

SET @sql = NULL;

SELECT GROUP_CONCAT(DISTINCT

CONCAT('SUM(CASE WHEN category = ''', category, ''' THEN amount ELSE 0 END) AS `', category, '`')

) INTO @sql

FROM sales_data;

SET @sql = CONCAT('SELECT year, ', @sql, ' FROM sales_data GROUP BY year');

PREPARE stmt FROM @sql;

EXECUTE stmt;

DEALLOCATE PREPARE stmt;

三、数据类型转换(Data Type Conversion)

在MySQL中转换数据类型,需注意兼容性和精度损失。

  1. 显式转换:使用CAST()函数

-- 将字符串转为日期类型

SELECT CAST('2025-06-20' AS DATE) AS date_value;

-- 将数字转为字符串(常用于拼接)

SELECT CONCAT('订单金额:', CAST(amount AS CHAR)) AS order_info

FROM orders;

  1. 显式转换:使用CONVERT()函数

-- 将字符串转为DECIMAL类型(保留2位小数)

SELECT CONVERT('123.45', DECIMAL(10,2)) AS price;

-- 将日期转为UNIX时间戳

SELECT CONVERT('2025-06-20', UNSIGNED) AS timestamp_value;

  1. 隐式转换(MySQL自动转换,但需注意风险)

-- 字符串自动转数字(仅当字符串为纯数字时有效)

SELECT '123' + 456; -- 结果:579

-- 日期字符串自动转日期类型(需符合格式)

INSERT INTO dates (date_col) VALUES ('2025-06-20');

注意事项

  • 数据去重:使用 DISTINCT 时会对所有列去重,性能低于 GROUP BY ;删除重复行前建议先备份数据。

  • 行转列:手动编写CASE WHEN适用于列数固定的场景,动态SQL需注意SQL注入风险。

  • 类型转换:隐式转换可能导致意外错误(如 'abc' + 1 会转为 0 + 1 ),建议优先使用显式转换。

相关推荐
五岳10 分钟前
DTS按业务场景批量迁移阿里云MySQL库实战(上):技术选型和API对接
mysql·阿里云·dts
我科绝伦(Huanhuan Zhou)14 分钟前
脚本再升级,兼容Oracle 26ai一键安装
数据库·oracle
野生绿箭侠1 小时前
Ncos 2.3.2 版本集成达梦数据库
数据库
仍然.1 小时前
MYSQL--约束
数据库·mysql
乡野码圣2 小时前
【RK3588 Android12】RCU机制
java·jvm·数据库
亓才孓2 小时前
[数据库]应该注意的细节
数据库·sql
m0_561359673 小时前
掌握Python魔法方法(Magic Methods)
jvm·数据库·python
xxxmine3 小时前
redis学习
数据库·redis·学习
qq_5470261793 小时前
Redis 常见问题
数据库·redis·mybatis
APIshop4 小时前
Java 实战:调用 item_search_tmall 按关键词搜索天猫商品
java·开发语言·数据库