SQL如何利用聚合函数生成业务分析指标_KPI计算基础教程

qq_342295822026-04-23 13:02

KPI查询常见错误包括：GROUP BY后SELECT列必须为分组列或聚合列；COUNT(*)与COUNT(字段)对NULL处理不同；窗口函数如LAG可安全实现同比/环比；WHERE过滤行级数据，HAVING过滤分组结果。GROUP BY 后 SELECT 列必须是聚合列或分组列这是写 KPI 查询时最常报错的地方，比如 SELECT user_id, COUNT(*) FROM orders GROUP BY status 会直接报错------user_id 既没参与 GROUP BY，也没被聚合函数包裹。数据库不知道该取哪一行的 user_id。正确做法只有两种：把 user_id 加进 GROUP BY（适合分析每个用户在各状态下的订单数）用聚合函数包裹，比如 MAX(user_id) 或 ANY_VALUE(user_id)（MySQL 5.7+），但得清楚语义：你并不真需要具体哪个 user_id，只是占位或辅助去重注意 ANY_VALUE() 不是标准 SQL，PostgreSQL 用 MIN()/MAX() 替代更稳妥；SQL Server 要靠子查询或窗口函数绕开。COUNT(*) vs COUNT(字段) 的语义差异直接影响 KPI 分母算"下单用户数"还是"支付成功用户数"，差一个 IS NOT NULL 就可能翻车。比如 COUNT(user_id) 会自动跳过 NULL 值，而 COUNT(*) 统计所有行。常见陷阱：用 COUNT(create_time) 算日活，但某些测试订单 create_time 是 NULL，结果漏掉这批数据想统计"有手机号的用户数"，写了 COUNT(phone)，结果发现部分老数据存的是空字符串 ''，它不等于 NULL，照样被计入更安全的写法是显式过滤：COUNT(CASE WHEN phone != '' AND phone IS NOT NULL THEN 1 END)。用窗口函数补全"同比/环比"这类跨行指标单纯 GROUP BY 只能算静态聚合，但 KPI 常要"本月销售额 / 上月销售额"。这时候硬写两个子查询 JOIN 很容易漏月、对不齐维度。唱鸭音乐创作全流程的AI自动作曲工具，集 AI 辅助作词、AI 自动作曲、编曲、混音于一体