SQL,根据数据的时间跨度进行不同粒度的统计

MSSQL 的某个视图会生成时间跨度不同的数据,当时间跨度小于 30 天时:

|----|----------|------------|-------------------------|
| id | branchId | totalPrice | createdAt |
| 85 | 1 | 2718.66 | 2022-07-03 08:49:27.727 |
| 26 | 1 | 3832.69 | 2022-07-06 09:08:06.880 |
| 89 | 1 | 9569.85 | 2022-07-07 04:13:09.230 |
| 80 | 1 | 1523.62 | 2022-07-07 04:38:29.313 |
| 15 | 1 | 2500.21 | 2022-07-11 09:01:05.183 |
| 5 | 1 | 6874.03 | 2022-07-14 23:54:05.590 |
| 45 | 1 | 9188.03 | 2022-07-17 05:35:48.560 |
| 98 | 1 | 4426.17 | 2022-07-21 17:35:31.617 |
| 54 | 1 | 3862.86 | 2022-07-22 05:18:28.553 |
| 70 | 1 | 5668.82 | 2022-07-22 06:12:33.867 |
| 65 | 1 | 3653.67 | 2022-07-26 08:29:03.587 |

需要按branchId和日期分组,对 totalPrice 求和,结果应当如下:

|----------|---------------|------------|
| branchId | sumTotalPrice | timeFrame |
| 1 | 2718.66 | 2022-07-03 |
| 1 | 3832.69 | 2022-07-06 |
| 1 | 11093.47 | 2022-07-07 |
| 1 | 2500.21 | 2022-07-11 |
| 1 | 6874.03 | 2022-07-14 |
| 1 | 9188.03 | 2022-07-17 |
| 1 | 4426.17 | 2022-07-21 |
| 1 | 9531.68 | 2022-07-22 |
| 1 | 3653.67 | 2022-07-26 |

当时间跨度大于等于 30 天且小于 365 天时:

|----|----------|------------|-------------------------|
| id | branchId | totalPrice | createdAt |
| 52 | 4 | 7502.97 | 2023-11-01 17:49:51.110 |
| 56 | 4 | 7337.75 | 2023-11-06 15:38:57.567 |
| 44 | 4 | 9385.97 | 2024-01-18 11:19:04.460 |

则要按branchId和月份分组,对 totalPrice 求和。注意:格式保持不变,输出的时间字段取当月的第一天。

|----------|---------------|------------|
| branchId | sumTotalPrice | timeFrame |
| 4 | 14840.72 | 2023-11-01 |
| 4 | 9385.97 | 2024-01-01 |

当时间跨度大于等于 365 天时:

|----|----------|------------|-------------------------|
| id | branchId | totalPrice | createdAt |
| 22 | 2 | 5589.39 | 2020-05-23 15:22:14.703 |
| 46 | 2 | 6103.08 | 2020-08-18 03:58:14.973 |
| 48 | 2 | 4905.96 | 2020-10-14 23:57:48.680 |
| 85 | 2 | 8953.03 | 2021-08-15 11:16:34.627 |
| 6 | 2 | 8132.46 | 2021-08-26 21:27:21.627 |
| 53 | 2 | 1913.24 | 2021-09-20 17:41:13.793 |
| 4 | 2 | 3164.81 | 2022-03-18 04:24:40.840 |
| 28 | 2 | 3506.16 | 2022-05-20 17:48:44.330 |
| 37 | 2 | 7256.73 | 2022-07-25 20:45:16.497 |
| 16 | 2 | 7470.38 | 2023-01-22 18:33:07.163 |
| 27 | 2 | 5957.58 | 2023-03-22 03:04:02.687 |
| 99 | 2 | 7722.43 | 2023-04-14 21:22:38.160 |
| 81 | 2 | 4517.39 | 2023-04-25 11:25:17.900 |
| 70 | 2 | 5562.04 | 2023-05-10 08:19:35.200 |
| 55 | 2 | 9343.17 | 2023-11-17 08:56:09.870 |
| 94 | 2 | 1056.38 | 2024-01-03 18:36:24.743 |
| 47 | 2 | 8434.11 | 2024-03-23 09:07:31.743 |

要按branchId和年份分组,同样对 totalPrice 求和。注意:时间字段取当年的第一天。

|----------|---------------|------------|
| branchId | sumTotalPrice | timeFrame |
| 2 | 16598.43 | 2020-01-01 |
| 2 | 18998.73 | 2021-01-01 |
| 2 | 13927.7 | 2022-01-01 |
| 2 | 40572.99 | 2023-01-01 |
| 2 | 9490.49 | 2024-01-01 |

编写SPL代码

|---|-----------------------------------------------------------------------------------------------------------------------------------|
| |  A |
| 1 | =MSSQL.query("select * from tb") |
| 2 | =interval(A1.min(date(createdAt)),A1.max(date(createdAt))) |
| 3 | =A1.groups(branchId, date(createdAt,if(A2>=356:"yyyy",A2<30: "yyyy-MM-dd";"yyyy-MM")):timeFrame; sum(totalPrice):sumTotalPrice) |
| 4 | =A3.new(#1,#3,#2) |

A1:通过JDBC查询视图。

A2:计算时间跨度。

A3:分组汇总。当跨度大于365天时,时间格式掩码为yyyy,跨度小于30天时,掩码为yyyy-MM-dd,其他跨度时设置为yyyy-MM。date函数对yyyy掩码的时间字符串返回当年的第一天,对yyyy-MM掩码的时间字符串返回当月的第一天。

A4:调整字段顺序,以符合格式要求。

SPL已开源免费,欢迎下载试用

相关推荐
暮湫1 小时前
MySQL(1)概述
数据库·mysql
唯余木叶下弦声1 小时前
PySpark之金融数据分析(Spark RDD、SQL练习题)
大数据·python·sql·数据分析·spark·pyspark
fajianchen1 小时前
记一次线上SQL死锁事故:如何避免死锁?
数据库·sql
chengpei1471 小时前
实现一个自己的spring-boot-starter,基于SQL生成HTTP接口
java·数据库·spring boot·sql·http
叫我:松哥1 小时前
基于Python django的音乐用户偏好分析及可视化系统设计与实现
人工智能·后端·python·mysql·数据分析·django
中东大鹅3 小时前
MongoDB的索引与聚合
数据库·hadoop·分布式·mongodb
天天向上杰4 小时前
简识Redis 持久化相关的 “Everysec“ 策略
数据库·redis·缓存
Leaf吧4 小时前
springboot 配置多数据源以及动态切换数据源
java·数据库·spring boot·后端
狮歌~资深攻城狮5 小时前
TiDB出现后,大数据技术的未来方向
数据库·数据仓库·分布式·数据分析·tidb
狮歌~资深攻城狮5 小时前
TiDB 和信创:如何推动国产化数据库的发展?
数据库·数据仓库·分布式·数据分析·tidb