Oracle 分析函数(Analytic Functions)

Oracle 的分析函数(Analytic Functions)是一类特殊的函数,用于在查询结果的窗口(window) 内执行计算(如排名、累计求和、移动平均等),不会聚合结果行 ,而是为每一行返回一个计算结果。它们通常与 OVER() 子句结合使用,是处理复杂分析需求(如分组排名、累计统计等)的高效工具。

分析函数核心语法

analytic_function([arguments])

OVER (

PARTITION BY partition_clause\] -- 将数据划分为多个窗口(类似GROUP BY) \[ORDER BY order_clause\] -- 定义窗口内的排序规则 \[window_clause\] -- 定义窗口范围(如滑动窗口) )

常见分析函数分类

分类 函数示例 用途
排名函数 ROW_NUMBER(), RANK(), DENSE_RANK() 为行分配排名(如第1名、第2名)
聚合函数 SUM(), AVG(), COUNT(), MAX(), MIN() 计算窗口内的聚合值(如累计求和、移动平均)
偏移函数 LAG(), LEAD(), FIRST_VALUE(), LAST_VALUE() 访问窗口内其他行的数据(如前一行、后一行)
分布函数 CUME_DIST(), PERCENT_RANK(), NTILE() 计算分布相关的统计(如百分位、分桶)

经典示例

sql 复制代码
CREATE TABLE sales (
  product VARCHAR2(20),
  sale_date DATE,
  amount NUMBER
);

INSERT INTO sales VALUES ('A', DATE '2023-01-01', 100);
INSERT INTO sales VALUES ('A', DATE '2023-01-02', 200);
INSERT INTO sales VALUES ('B', DATE '2023-01-01', 150);
INSERT INTO sales VALUES ('B', DATE '2023-01-03', 300);


计算每个产品的累计销售额

SELECT 
  product,
  sale_date,
  amount,
  SUM(amount) OVER (
    PARTITION BY product 
    ORDER BY sale_date 
    ROWS BETWEEN UNBOUNDED PRECEDING AND CURRENT ROW
  ) AS cumulative_amount
FROM sales;


PRODUCT | SALE_DATE  | AMOUNT | CUMULATIVE_AMOUNT
--------|------------|--------|-------------------
A       | 2023-01-01 | 100    | 100
A       | 2023-01-02 | 200    | 300
B       | 2023-01-01 | 150    | 150
B       | 2023-01-03 | 300    | 450
sql 复制代码
计算每个产品的销售额排名
SELECT 
  product,
  sale_date,
  amount,
  RANK() OVER (
    PARTITION BY product 
    ORDER BY amount DESC
  ) AS sales_rank
FROM sales;

PRODUCT | SALE_DATE  | AMOUNT | SALES_RANK
--------|------------|--------|-----------
A       | 2023-01-02 | 200    | 1
A       | 2023-01-01 | 100    | 2
B       | 2023-01-03 | 300    | 1
B       | 2023-01-01 | 150    | 2
sql 复制代码
获取每个产品的前一行销售额(LAG)

SELECT 
  product,
  sale_date,
  amount,
  LAG(amount, 1, 0) OVER (
    PARTITION BY product 
    ORDER BY sale_date
  ) AS prev_amount
FROM sales;

PRODUCT | SALE_DATE  | AMOUNT | PREV_AMOUNT
--------|------------|--------|------------
A       | 2023-01-01 | 100    | 0          -- 无前一行,默认0
A       | 2023-01-02 | 200    | 100
B       | 2023-01-01 | 150    | 0
B       | 2023-01-03 | 300    | 150

关键子句详解

  1. PARTITION BY

    将数据划分为多个窗口,每个窗口独立计算。类似于 GROUP BY,但不会减少行数。

  2. ORDER BY

    定义窗口内的排序规则,影响排名、累计计算等。

  3. 窗口帧(Window Frame)

    通过 ROWSRANGE 定义窗口范围,常见用法:

    • ROWS BETWEEN UNBOUNDED PRECEDING AND CURRENT ROW:从第一行到当前行(累计计算)。

    • ROWS BETWEEN 1 PRECEDING AND 1 FOLLOWING:前一行到后一行(滑动窗口)。

常见问题

  1. 分析函数与聚合函数的区别?

    聚合函数(如 SUM())会合并多行为一行,而分析函数会为每一行返回结果。

  2. 如何优化分析函数性能?

    合理使用 PARTITION BY 和索引,避免全表扫描。

  3. RANK() vs DENSE_RANK() vs ROW_NUMBER()

    • RANK():允许并列排名,后续排名跳跃(如 1,1,3)。

    • DENSE_RANK():允许并列排名,后续排名连续(如 1,1,2)。

    • ROW_NUMBER():无并列,严格递增(如 1,2,3)。

相关推荐
西门吹雪分身9 分钟前
Redis之RedLock算法以及底层原理
数据库·redis·算法
一代...10 分钟前
【redis】初识redis
数据库·redis·缓存
clarance201515 分钟前
MCP技术革命:元控制协议如何重构AI与数据库的交互范式
数据库·人工智能·重构
Arbori_2621530 分钟前
Oracle REGEXP_SUBSTR
数据库·oracle
solihawk31 分钟前
国产数据库与Oracle数据库事务差异分析
数据库·oracle
·云扬·1 小时前
【BUG】Redis RDB快照持久化及写操作禁止问题排查与解决
数据库·redis·bug
橘猫云计算机设计1 小时前
基于django云平台的求职智能分析系统(源码+lw+部署文档+讲解),源码可白嫖!
数据库·spring boot·后端·python·django·毕业设计
babytiger2 小时前
Ubuntu2404装机指南
数据库·postgresql
镜舟科技2 小时前
如何高效使用 Text to SQL 提升数据分析效率?四个关键应用场景解析
数据库·sql·数据分析
King.6242 小时前
数据服务化 VS 数据中台:战略演进中的价值重构
大数据·数据库·sql·oracle·重构