SQL如何利用聚合函数生成业务分析指标_KPI计算基础教程

KPI查询常见错误包括:GROUP BY后SELECT列必须为分组列或聚合列;COUNT(*)与COUNT(字段)对NULL处理不同;窗口函数如LAG可安全实现同比/环比;WHERE过滤行级数据,HAVING过滤分组结果。GROUP BY 后 SELECT 列必须是聚合列或分组列这是写 KPI 查询时最常报错的地方,比如 SELECT user_id, COUNT(*) FROM orders GROUP BY status 会直接报错------user_id 既没参与 GROUP BY,也没被聚合函数包裹。数据库不知道该取哪一行的 user_id。正确做法只有两种:把 user_id 加进 GROUP BY(适合分析每个用户在各状态下的订单数)用聚合函数包裹,比如 MAX(user_id) 或 ANY_VALUE(user_id)(MySQL 5.7+),但得清楚语义:你并不真需要具体哪个 user_id,只是占位或辅助去重注意 ANY_VALUE() 不是标准 SQL,PostgreSQL 用 MIN()/MAX() 替代更稳妥;SQL Server 要靠子查询或窗口函数绕开。COUNT(*) vs COUNT(字段) 的语义差异直接影响 KPI 分母算"下单用户数"还是"支付成功用户数",差一个 IS NOT NULL 就可能翻车。比如 COUNT(user_id) 会自动跳过 NULL 值,而 COUNT(*) 统计所有行。常见陷阱:用 COUNT(create_time) 算日活,但某些测试订单 create_time 是 NULL,结果漏掉这批数据想统计"有手机号的用户数",写了 COUNT(phone),结果发现部分老数据存的是空字符串 '',它不等于 NULL,照样被计入更安全的写法是显式过滤:COUNT(CASE WHEN phone != '' AND phone IS NOT NULL THEN 1 END)。用窗口函数补全"同比/环比"这类跨行指标单纯 GROUP BY 只能算静态聚合,但 KPI 常要"本月销售额 / 上月销售额"。这时候硬写两个子查询 JOIN 很容易漏月、对不齐维度。 唱鸭 音乐创作全流程的AI自动作曲工具,集 AI 辅助作词、AI 自动作曲、编曲、混音于一体

相关推荐
m0_515098422 小时前
SQL查询如何处理分组后的NULL值_使用COALESCE配合聚合函数
jvm·数据库·python
斯班奇的好朋友阿法法2 小时前
本地ollama大模型速度慢的优化
python·语言模型
PaperData2 小时前
1990-2025年企业基金退出事件数据
数据库·数据分析·经管
江山与紫云2 小时前
1.3 使用 Jupyter Notebook
python
Bert.Cai2 小时前
MySQL DDL简介
数据库·mysql
ClouGence2 小时前
从 OLTP 到 OLAP:Spanner 到 StarRocks 架构演进与实现
大数据·数据库·starrocks·olap·dba·oltp·spanner
Metaphor6922 小时前
使用 Python 合并 PDF 文件
java·python·pdf
亚林瓜子2 小时前
AWS Glue PySpark中日志设置
python·spark·日志·aws·pyspark·log·glue
qiuyunoqy2 小时前
Redis 常见数据结构,编码方式
数据库·redis·缓存