【工作记录】mysql中实现分组统计的三种方式

前言

实际工作中对范围分组统计的需求还是相对普遍的,本文记录下在mysql中通过函数和sql完成分组统计的实现过程。

数据及期望

比如我们获取到了豆瓣电影top250,现在想知道各个分数段的电影总数.

表数据如下:

期望结果:

实现方案

主要思路是根据score的范围设置别名,然后按照别名统计即可。

方案一:

sql 复制代码
select tmp.level, count(1) as cnt from
    (select
        score,
        case
            when score >= 7 and score < 8 then '[7,8)'
            when score >= 8 and score < 8.5 then '[8,8.5)'
            when score >= 8.5 and score < 9 then '[8.5,9)'
            when score >= 9 and score < 9.5 then '[9,9.5)'
            when score >= 9.5 and score < 10 then '[9.5,10)'
        end as level
    from `douban_movie_top250` limit 20 ) tmp
group by tmp.level
order by tmp.level asc

方案二:

mysql 复制代码
select
    case tmp.level
        when 1 then '[7,8)'
        when 2 then '[8,8.5)'
        when 3 then '[8.5,9)'
        when 4 then '[9,9.5)'
        when 5 then '[9.5,10)'
    end as level, count(1) as cnt
from
	(select score, interval(score, 7, 8, 8.5, 9, 9.5) as level from `douban_movie_top250` limit 20) tmp
group by tmp.level
order by tmp.level asc

INTERVAL()函数介绍

INTERVAL()函数可以返回分段后的结果,语法如下:

​ INTERVAL(N,N1,N2,N3,...)

其中,N是要判断的数值,N1,N2,N3,...是分段的间隔。

sql中用到了interval函数,interval(score, 7, 8, 8.5, 9, 9.5)返回的是score所处阶段的索引,比如返回1代表score在[7,8)范围内,前闭后开,依次类推。

分数段 对应值
[7,8) 1
[8,8.5) 2
[8.5,9) 3
[9,9.5) 4
[9.5,10) 5

我们直接查询下这个函数使用的结果验证下:

sql 复制代码
select score, interval(score, 7, 8, 8.5, 9, 9.5) as level 
from `douban_movie_top250` limit 20

结果如下:

可以看到验证结果是正确的,依据这个特性还是可以做不少事情的。

方案三:

sql 复制代码
select level, count(1) as cnt from (
	select score, elt(interval(score, 7, 8, 8.5, 9, 9.5), '[7,8)','[8,8.5)', '[8.5,9)', '[9,9.5)','[9.5,10)') as level
	from `douban_movie_top250` limit 20) tmp
group by tmp.level order by tmp.level asc;

这个sql中用到了elt函数和interval函数,大致可以猜测到elt函数做的事情就是上面方案二中case...when...做的事情。

ELT函数简介

​ ELT()函数是分值函数,功能有点类似很多编程语言中的switch关键字。

语法:

​ ELT(N,str1,str2,str3,...)

其中N是要判断的数值,如果N=1,则返回str1,如果N=2,则返回str2,以此类推。

总结

本文针对分组统计提出了三种实现方式,各有优劣吧。

针对以上内容有任何疑问或者建议欢迎留言评论~

创作不易,欢迎一键三连~~~

相关推荐
云技纵横2 天前
唯一索引 INSERT 死锁实战:5 秒复现交叉插入的 S 锁循环等待
sql·mysql
沉默王二2 天前
面试官:RAG 不用向量数据库,用 MySQL 硬扛?我:100 万向量不是很轻松?
mysql·面试·ai编程
小猿姐3 天前
MySQL Top 10 热点问题 AI 运维实战:从内核诊断到云原生运维
mysql·云原生·aiops
云技纵横3 天前
Gap Lock 死锁实战:5 秒在本地复现 MySQL 间隙锁死锁
后端·mysql
无响应de神3 天前
三、用户与权限管理
数据库·mysql
摇滚侠4 天前
Linux CentOS7 rpm 安装 MySQL 5.7
linux·运维·mysql
ApacheSeaTunnel4 天前
实战演示 | 基于 Apache SeaTunnel 与 Apache DolphinScheduler 实现 MySQL 到 Doris 离线定时增量同步
大数据·mysql·开源·doris·数据集成·seatunnel·数据同步
DARLING Zero two♡4 天前
【MySQL数据库】数据类型与表约束
数据库·mysql
活宝小娜4 天前
mysql详细安装教程
数据库·mysql·adb