【请关注】mysql一些经常用到的高级SQL

经常去重复数据,数据需要转等操作,汇总高级SQL MySQL操作

一、数据去重(Data Deduplication)

去重常用于清除重复记录,保留唯一数据。

  1. 使用DISTINCT关键字去重单列

-- 从用户表中获取唯一的邮箱地址

SELECT DISTINCT email FROM users;

  1. 使用GROUP BY结合聚合函数去重多列

-- 按姓名和手机号去重,获取最新注册的用户

SELECT name, phone, MAX(register_time) AS latest_time

FROM users

GROUP BY name, phone;

  1. 使用CTE和ROW_NUMBER()窗口函数标记重复行并删除

-- 先标记重复行,再删除非首行记录

WITH DuplicateRows AS (

SELECT id, name, email,

ROW_NUMBER() OVER(PARTITION BY email ORDER BY id) AS row_num

FROM users

)

DELETE FROM DuplicateRows WHERE row_num > 1;

二、数据行转列(Pivot Table)

将行数据转换为列,常用于统计汇总场景。

  1. 使用CASE WHEN手动实现行转列

-- 统计每个用户的不同订单类型数量

SELECT user_id,

SUM(CASE WHEN order_type = '食品' THEN 1 ELSE 0 END) AS food_orders,

SUM(CASE WHEN order_type = '服装' THEN 1 ELSE 0 END) AS clothes_orders,

SUM(CASE WHEN order_type = '数码' THEN 1 ELSE 0 END) AS digital_orders

FROM orders

GROUP BY user_id;

  1. 使用IF函数结合GROUP BY实现动态列

-- 按月份统计销售额(假设月份存于month列)

SELECT product_id,

SUM(IF(month = 1, sales_amount, 0)) AS jan_sales,

SUM(IF(month = 2, sales_amount, 0)) AS feb_sales,

SUM(IF(month = 3, sales_amount, 0)) AS mar_sales

FROM sales

GROUP BY product_id;

  1. 使用动态SQL生成行转列语句(适用于列名不确定的场景)

-- 动态生成SQL(需先查询列名)

SET @sql = NULL;

SELECT GROUP_CONCAT(DISTINCT

CONCAT('SUM(CASE WHEN category = ''', category, ''' THEN amount ELSE 0 END) AS `', category, '`')

) INTO @sql

FROM sales_data;

SET @sql = CONCAT('SELECT year, ', @sql, ' FROM sales_data GROUP BY year');

PREPARE stmt FROM @sql;

EXECUTE stmt;

DEALLOCATE PREPARE stmt;

三、数据类型转换(Data Type Conversion)

在MySQL中转换数据类型,需注意兼容性和精度损失。

  1. 显式转换:使用CAST()函数

-- 将字符串转为日期类型

SELECT CAST('2025-06-20' AS DATE) AS date_value;

-- 将数字转为字符串(常用于拼接)

SELECT CONCAT('订单金额:', CAST(amount AS CHAR)) AS order_info

FROM orders;

  1. 显式转换:使用CONVERT()函数

-- 将字符串转为DECIMAL类型(保留2位小数)

SELECT CONVERT('123.45', DECIMAL(10,2)) AS price;

-- 将日期转为UNIX时间戳

SELECT CONVERT('2025-06-20', UNSIGNED) AS timestamp_value;

  1. 隐式转换(MySQL自动转换,但需注意风险)

-- 字符串自动转数字(仅当字符串为纯数字时有效)

SELECT '123' + 456; -- 结果:579

-- 日期字符串自动转日期类型(需符合格式)

INSERT INTO dates (date_col) VALUES ('2025-06-20');

注意事项

  • 数据去重:使用 DISTINCT 时会对所有列去重,性能低于 GROUP BY ;删除重复行前建议先备份数据。

  • 行转列:手动编写CASE WHEN适用于列数固定的场景,动态SQL需注意SQL注入风险。

  • 类型转换:隐式转换可能导致意外错误(如 'abc' + 1 会转为 0 + 1 ),建议优先使用显式转换。

相关推荐
cui_ruicheng7 小时前
MySQL(四):数据类型与字段设计
数据库·mysql
皮皮学姐分享-ppx8 小时前
政府绿色采购数据库(2015-2024.3)
大数据·网络·数据库·人工智能·制造
闪电悠米9 小时前
黑马点评-Redis 消息队列-03_stream_consumer_group
开发语言·数据库·redis·分布式·缓存·junit·lua
DIY源码阁10 小时前
JavaSwing航班订票管理系统 - MySQL版
数据库·mysql
浪客灿心11 小时前
项目篇:模块设计与实现
数据库·c++
流星白龙13 小时前
【MySQL高阶】26.事务(1)
数据库·mysql
三十..13 小时前
Redis 核心原理与高可用架构实践
运维·数据库·redis
这个DBA有点耶14 小时前
索引优化深潜(下):索引合并、ICP 与索引设计的实战法则
数据库·mysql·架构
用户30745969820714 小时前
EXPLAIN 执行计划 完全精通指南
mysql
努力努力再努力wz14 小时前
【内存管理与高并发内存池系列】从 mmap 到 malloc:文件映射、匿名映射与 glibc 内存分配机制详解
linux·c语言·数据结构·数据库·c++·qt·链表