PostgreSQL的聚集函数

在日常工作中,无论是处理销售数据、分析用户行为,还是统计气象信息,我们常常需要从大量数据中提取关键信息。

在PostgreSQL里,聚集函数就能帮你搞定这些事。它能从多行数据中计算出一个结果,如:

count(计数): 能数出有多少条记录

sum(和) :能算出数值的总和

avg(均值) :能得出平均值

max(最大值) 和 min(最小值):能找出最大值和最小值。

假设查询天气表weather记录城市的最低温度temp_low。

复制代码
SELECT max(temp_lo) FROM weather;

一.WHERE子句进行条件筛选****

WHERE子句的作用是在聚集计算之前筛选出符合条件的行,而聚集函数的结果是在行筛选之后才计算出来的。

复制代码
SELECT city FROM weatherWHERE temp_low = (SELECT max(temp_low) FROM weather);

注意:不能直接在WHERE子句里用max(temp_low)。

二.GROUP BY分组统计

当数据量大且包含多种分类时,GROUP BY子句就派上用场了。

比如,我们想看看每个城市的天气记录数量以及城市的最低温度中最高值,就可以这样写:

​​​​​​​

复制代码
SELECT city, count(*), max(temp_low)FROM weatherGROUP BY city;

把天气表数据按城市分类,然后将分类数据进行统计,显示每个城市有多少条记录,以及每个城市最低温度中的最高值。

还可以用HAVING子句来过滤上面分组后的数据。比如只看每个城市最低温度中最高值小于10的城市,可以在上面语句上加having条件,如下

​​​​​​​

复制代码
SELECT city, count(*), max(temp_low)FROM weatherGROUP BY cityHAVING max(temp_low) < 10;

分类统计之后,再把不符合要求的分类结果去掉。

注意:where和having的区别。where 是在分组和聚集计算之前筛选数据,而having是在分组和聚集计算之后筛选分组。

三.FILTER 精细化聚集控制

PostgreSQL还提供了一个很实用的功能------filter。可以让聚集函数只对符合条件的行进行计算。

比如统计每个城市中最低温度小于10的数量,但又不影响其他聚集函数的计算,可以这样写:

​​​​​​​

复制代码
SELECT city, count(*) FILTER (WHERE temp_low < 10), max(temp_low)FROM weatherGROUP BY city;

为count函数加了一个"过滤器",只即使最低温度小于10的行,而max函数还是对所有记录计算,实现更加灵活的精细化控制。

最后

PostgreSQL的聚集函数是一个强大的工具。通过合理使用WHERE、GROUP BY、HAVING和FILTER,可以精确地控制数据的筛选、分组和统计过程,让数据为我们更好地服务。

掌握这些技巧能让我们在数据处理的道路上更加得心应手。

相关推荐
Hello.Reader1 小时前
Redis 延迟监控深度指南
数据库·redis·缓存
ybq195133454311 小时前
Redis-主从复制-分布式系统
java·数据库·redis
好奇的菜鸟4 小时前
如何在IntelliJ IDEA中设置数据库连接全局共享
java·数据库·intellij-idea
tan180°4 小时前
MySQL表的操作(3)
linux·数据库·c++·vscode·后端·mysql
满昕欢喜5 小时前
SQL Server从入门到项目实践(超值版)读书笔记 20
数据库·sql·sqlserver
Hello.Reader6 小时前
Redis 延迟排查与优化全攻略
数据库·redis·缓存
简佐义的博客7 小时前
破解非模式物种GO/KEGG注释难题
开发语言·数据库·后端·oracle·golang
爬山算法7 小时前
MySQL(116)如何监控负载均衡状态?
数据库·mysql·负载均衡
老纪的技术唠嗑局9 小时前
OceanBase PoC 经验总结(二)—— AP 业务
数据库
阿里云大数据AI技术10 小时前
OpenSearch 视频 RAG 实践
数据库·人工智能·llm