Oracle 高阶函数与高级功能详解

Oracle 数据库提供了丰富的高级函数和功能，以应对复杂的数据处理和分析需求。这些功能扩展了基本 SQL 查询的能力，包括：

分析函数 和 窗口函数：用于执行复杂的数据分析和分区计算，如排名、累计总和和窗口内的计算。
集合操作符：支持对多个查询结果进行合并、比较和排除重复项，帮助进行集合间的操作。
递归查询：允许对层次结构数据进行递归处理，适用于树形数据的查询和分析。
正则表达式函数：提供强大的文本模式匹配和替换功能，适用于复杂的文本处理。
字符串函数 、日期和时间函数 、以及 数学函数：处理和操作字符串、日期时间和数值数据，支持各种数据格式化和计算需求。
更多高级函数：包括 XML 和 JSON 数据处理、数据库链接、物化视图、复杂聚合等功能，扩展了 SQL 查询的应用范围。

掌握这些高级功能将帮助用户更高效地管理和分析数据，提升查询性能和数据操作的灵活性，满足复杂的业务需求。

一、分析函数

分析函数用于对结果集中的数据进行排序和排名分析。

1.1 RANK()

功能: 计算排序后的排名，对于相同值排名相同，排名之间可能有间隔。

示例:

sql 复制代码

-- 按薪资降序对员工进行排名
SELECT employee_id, salary,
RANK() OVER (ORDER BY salary DESC) AS salary_rank
FROM employees;

解释:

RANK() OVER (ORDER BY salary DESC)：按照薪资从高到低排序，并为每个员工分配排名。相同薪资的员工会有相同的排名，但排名之间可能有间隔（例如，如果前两名都是 1，那么第三名可能是 3）。

1.2 DENSE_RANK()

功能: 计算排序后的排名，对于相同值排名相同，但排名之间没有间隔。

示例:

sql 复制代码

-- 按薪资降序对员工进行紧密排名
SELECT employee_id, salary,
DENSE_RANK() OVER (ORDER BY salary DESC) AS salary_rank
FROM employees;

解释:

DENSE_RANK() OVER (ORDER BY salary DESC)：类似于 RANK，但排名之间不会有间隔。例如，如果前两名都是 1，那么第三名将是 2，而不是 3。

1.3 ROW_NUMBER()

功能: 为查询结果中的每一行分配一个唯一的序号，从 1 开始。

示例:

sql 复制代码

-- 按薪资降序为每个员工分配一个唯一的行号
SELECT employee_id, salary,
ROW_NUMBER() OVER (ORDER BY salary DESC) AS row_num
FROM employees;

解释:

ROW_NUMBER() OVER (ORDER BY salary DESC)：按照薪资从高到低排序，并为每行分配一个唯一的序号，无论薪资是否相同。

1.4 NTILE()

功能: 将结果集分成指定数量的组，并为每一行分配组编号。

示例:

sql 复制代码

-- 将员工按薪资降序分成 4 组，每组分配一个编号
SELECT employee_id, salary,
NTILE(4) OVER (ORDER BY salary DESC) AS quartile
FROM employees;

解释:

NTILE(4) OVER (ORDER BY salary DESC)：将结果集按照薪资从高到低分成 4 组，每组编号为 1 到 4。

1.5 LEAD() 和 LAG()

功能: LEAD() 用于访问当前行的下一行数据，LAG() 用于访问当前行的上一行数据。

示例:

sql 复制代码

-- 返回每个员工的下一个和上一个薪资
SELECT employee_id, salary,
LEAD(salary, 1) OVER (ORDER BY salary DESC) AS next_salary,
LAG(salary, 1) OVER (ORDER BY salary DESC) AS previous_salary
FROM employees;

解释:

LEAD(salary, 1) OVER (ORDER BY salary DESC)：获取当前行之后 1 行的薪资。
LAG(salary, 1) OVER (ORDER BY salary DESC)：获取当前行之前 1 行的薪资。

二、窗口函数

窗口函数允许在结果集中计算聚合值，不会改变结果集的行数。

2.1 SUM()

功能: 计算分区内所有行的总和。

示例:

sql 复制代码

-- 按部门计算每个员工的总薪资
SELECT department_id, employee_id, salary,
SUM(salary) OVER (PARTITION BY department_id) AS dept_total_salary
FROM employees;

解释:

SUM(salary) OVER (PARTITION BY department_id)：按部门对员工薪资进行分组，计算每个部门的薪资总和。

2.2 AVG()

功能: 计算分区内所有行的平均值。

示例:

sql 复制代码

-- 按部门计算每个员工的平均薪资
SELECT department_id, employee_id, salary,
AVG(salary) OVER (PARTITION BY department_id) AS dept_avg_salary
FROM employees;

解释:

AVG(salary) OVER (PARTITION BY department_id)：按部门对员工薪资进行分组，计算每个部门的薪资平均值。

2.3 MIN() 和 MAX()

功能: 计算分区内的最小值和最大值。

示例:

sql 复制代码

-- 按部门计算每个员工的最低和最高薪资
SELECT department_id, employee_id, salary,
MIN(salary) OVER (PARTITION BY department_id) AS dept_min_salary,
MAX(salary) OVER (PARTITION BY department_id) AS dept_max_salary
FROM employees;

解释:

MIN(salary) OVER (PARTITION BY department_id)：按部门计算最低薪资。
MAX(salary) OVER (PARTITION BY department_id)：按部门计算最高薪资。

三、集合操作符

集合操作符用于合并、比较多个查询的结果集。

3.1 UNION

功能: 合并两个查询的结果集，并去除重复行。

示例:

sql 复制代码

-- 合并两个查询的结果集，去除重复行
SELECT employee_id, first_name, last_name FROM employees
UNION
SELECT employee_id, first_name, last_name FROM new_employees;

解释:

UNION 操作符将两个查询的结果集合并在一起，并自动去除重复的行。

3.2 INTERSECT

功能: 返回两个查询的结果集的交集。

示例:

sql 复制代码

-- 返回两个查询结果集的交集部分
SELECT employee_id, first_name, last_name FROM employees
INTERSECT
SELECT employee_id, first_name, last_name FROM new_employees;

解释:

INTERSECT 操作符返回两个查询结果集中的公共部分，即两个结果集都存在的行。

3.3 MINUS

功能: 返回第一个查询的结果集中不在第二个查询结果集中的部分。

示例:

sql 复制代码

-- 返回第一个查询结果集中不包含在第二个查询结果集中的部分
SELECT employee_id, first_name, last_name FROM employees
MINUS
SELECT employee_id, first_name, last_name FROM new_employees;

解释:

MINUS 操作符返回第一个结果集中存在但第二个结果集中不存在的行。

四、递归查询

递归查询用于处理层次结构的数据。

示例:

sql 复制代码

-- 递归查询构建员工层次结构
WITH EmployeeHierarchy (employee_id, manager_id, level) AS (
-- 基础查询，选择根节点（没有上级经理的员工）
SELECT employee_id, manager_id, 1 AS level
FROM employees
WHERE manager_id IS NULL
UNION ALL
-- 递归部分，选择每个员工的下属
SELECT e.employee_id, e.manager_id, eh.level + 1
FROM employees e
JOIN EmployeeHierarchy eh ON e.manager_id = eh.employee_id
)
SELECT employee_id, manager_id, level
FROM EmployeeHierarchy;

解释:

WITH EmployeeHierarchy AS (...)：定义一个递归公共表表达式（CTE）。基础查询选择没有上级经理的员工作为递归的起点。
UNION ALL：合并递归的结果。递归部分选择每个员工的下属，并增加层级。

五、正则表达式函数

正则表达式函数用于对字符串进行模式匹配和处理。

5.1 REGEXP_LIKE

功能: 判断字符串是否匹配正则表达式模式。

示例:

sql 复制代码

-- 返回所有名字以"A"开头的员工
SELECT first_name
FROM employees
WHERE REGEXP_LIKE(first_name, '^A.*');

解释:

REGEXP_LIKE(first_name, '^A.*')：检查 first_name 是否以字母"A"开头。

5.2 REGEXP_INSTR

功能: 返回正则表达式模式在字符串中首次出现的位置。

示例:

sql 复制代码

-- 返回员工名字中第一个小写字母"a"出现的位置
SELECT first_name, REGEXP_INSTR(first_name, 'a') AS position
FROM employees;

解释:

REGEXP_INSTR(first_name, 'a')：返回字符串中第一个小写字母"a"出现的位置。

5.3 REGEXP_SUBSTR
功能: 返回正则表达式模式匹配的子串。

示例:

sql 复制代码

-- 返回员工名字中符合正则表达式模式的子串
SELECT first_name, REGEXP_SUBSTR(first_name, '[A-Z][a-z]*') AS substring
FROM employees;

解释:

REGEXP_SUBSTR(first_name, '[A-Z][a-z]*')：返回名字中匹配大写字母开头跟随小写字母的子串。

5.4 REGEXP_REPLACE

功能: 将字符串中匹配正则表达式模式的部分替换为指定的字符串。

示例:

sql 复制代码

-- 将员工名字中的小写字母"a"替换为大写字母"A"
SELECT first_name, REGEXP_REPLACE(first_name, 'a', 'A') AS new_name
FROM employees;

解释:

REGEXP_REPLACE(first_name, 'a', 'A')：将名字中的所有小写字母"a"替换为大写字母"A"。

六、字符串函数

字符串函数用于对字符串进行各种操作。

6.1 CONCAT()

功能: 连接两个字符串。

示例:

sql 复制代码

-- 连接员工的名字和姓氏
SELECT CONCAT(first_name, ' ', last_name) AS full_name
FROM employees;

解释:

CONCAT(first_name, ' ', last_name)：将 first_name 和 last_name 连接成一个完整的名字。

6.2 SUBSTR()

功能: 截取字符串的一部分。

示例:

sql 复制代码

-- 截取员工名字的前两个字符
SELECT SUBSTR(first_name, 1, 2) AS name_prefix
FROM employees;

解释:

SUBSTR(first_name, 1, 2)：从 first_name 字符串的第一个字符开始，截取两个字符。

6.3 INSTR()

功能: 返回子串在字符串中出现的位置。

示例:

sql 复制代码

-- 返回员工名字中第一个小写字母"a"出现的位置
SELECT first_name, INSTR(first_name, 'a') AS position
FROM employees;

解释:

INSTR(first_name, 'a')：返回字符串中第一个小写字母"a"的位置。

6.4 LENGTH()

功能: 返回字符串的长度。

示例:

sql 复制代码

-- 返回员工名字的长度
SELECT first_name, LENGTH(first_name) AS name_length
FROM employees;

解释:

LENGTH(first_name)：计算 first_name 字符串的长度。

6.5 UPPER() 和 LOWER()

功能: 将字符串转换为大写或小写。

示例:

sql 复制代码

-- 将员工名字转换为大写和小写
SELECT first_name, UPPER(first_name) AS upper_name, LOWER(first_name) AS lower_name
FROM employees;

解释:

UPPER(first_name)：将名字转换为大写字母。
LOWER(first_name)：将名字转换为小写字母。

6.6 TRIM()

功能: 去除字符串两端的空格或指定字符。

示例:

sql 复制代码

-- 去除员工名字两端的空格
SELECT TRIM(first_name) AS trimmed_name
FROM employees;

解释:

TRIM(first_name)：去除 first_name 字符串两端的空格。

七、日期和时间函数

日期和时间函数用于对日期和时间进行各种操作。

7.1 SYSDATE 和 CURRENT_DATE

功能: 返回当前的日期和时间。

示例:

sql 复制代码

-- 返回当前的系统日期和当前会话的日期
SELECT SYSDATE AS system_date, CURRENT_DATE AS session_date
FROM dual;

解释:

SYSDATE：返回系统的当前日期和时间。
CURRENT_DATE：返回会话的当前日期和时间。

7.2 ADD_MONTHS()

功能: 返回指定日期增加指定月份数后的日期。

示例:

sql 复制代码

-- 返回员工入职日期增加6个月后的日期
SELECT hire_date, ADD_MONTHS(hire_date, 6) AS new_date
FROM employees;

解释:

ADD_MONTHS(hire_date, 6)：将 hire_date 日期增加 6 个月。

7.3 MONTHS_BETWEEN()

功能: 返回两个日期之间的月份数。

示例:

sql 复制代码

-- 返回员工入职日期和当前日期之间的月份数
SELECT hire_date, MONTHS_BETWEEN(SYSDATE, hire_date) AS months_diff
FROM employees;

解释:

MONTHS_BETWEEN(SYSDATE, hire_date)：计算当前日期和 hire_date 之间的月份数。

7.4 NEXT_DAY()

功能: 返回指定日期之后的第一个指定星期几的日期。

示例:

sql 复制代码

-- 返回员工入职日期之后的第一个星期一的日期
SELECT hire_date, NEXT_DAY(hire_date, 'MONDAY') AS next_monday
FROM employees;

解释:

NEXT_DAY(hire_date, 'MONDAY')：返回 hire_date 日期之后的第一个星期一。

7.5 LAST_DAY()

功能: 返回指定日期所在月份的最后一天的日期。

示例:

sql 复制代码

-- 返回员工入职日期所在月份的最后一天的日期
SELECT hire_date, LAST_DAY(hire_date) AS last_day_of_month
FROM employees;

解释:

LAST_DAY(hire_date)：返回 hire_date 所在月份的最后一天。

7.6 ROUND() 和 TRUNC()

功能: 对日期进行四舍五入和截断操作。

示例:

sql 复制代码

-- 对员工入职日期进行四舍五入和截断操作
SELECT hire_date, ROUND(hire_date, 'MONTH') AS rounded_date, TRUNC(hire_date, 'MONTH') AS truncated_date
FROM employees;

解释:

ROUND(hire_date, 'MONTH')：将 hire_date 四舍五入到所在月份的第一天。
TRUNC(hire_date, 'MONTH')：将 hire_date 截断到所在月份的第一天。

八、数学函数

数学函数用于对数值进行数学运算。

8.1 ABS()

功能: 返回数值的绝对值。

示例:

sql 复制代码

-- 返回员工薪资的绝对值
SELECT employee_id, salary, ABS(salary) AS abs_salary
FROM employees;

解释:

ABS(salary)：计算 salary 的绝对值。

8.2 CEIL() 和 FLOOR()

功能: CEIL() 返回大于或等于指定数值的最小整数，FLOOR() 返回小于或等于指定数值的最大整数。

示例:

sql 复制代码

-- 返回员工薪资的上限和下限
SELECT employee_id, salary, CEIL(salary) AS ceil_salary, FLOOR(salary) AS floor_salary
FROM employees;

解释:

CEIL(salary)：将薪资向上取整到最接近的整数。
FLOOR(salary)：将薪资向下取整到最接近的整数。

8.3 MOD()

功能: 返回两个数值相除的余数。

示例:

sql 复制代码

-- 返回员工薪资除以1000的余数
SELECT employee_id, salary, MOD(salary, 1000) AS mod_salary
FROM employees;

解释:

MOD(salary, 1000)：计算 salary 除以 1000 的余数。

8.4 POWER() 和 SQRT()

功能: POWER() 返回数值的指定次幂，SQRT() 返回数值的平方根。

示例:

sql 复制代码

-- 返回员工薪资的平方和平方根
SELECT employee_id, salary, POWER(salary, 2) AS squared_salary, SQRT(salary) AS sqrt_salary
FROM employees;

解释:

POWER(salary, 2)：计算 salary 的平方。
SQRT(salary)：计算 salary 的平方根。

8.5 EXP() 和 LOG()

功能: EXP() 返回数值的指数，LOG() 返回数值的对数。

示例:

sql 复制代码

-- 返回员工薪资的指数和对数
SELECT employee_id, salary, EXP(salary) AS exp_salary, LOG(salary) AS log_salary
FROM employees;

解释:

EXP(salary)：计算 salary 的指数。
LOG(salary)：计算 salary 的自然对数。

8.6 ROUND() 和 TRUNC()

功能: ROUND

() 和 TRUNC() 函数用于对数值进行四舍五入和截断操作。

示例:

sql 复制代码

-- 对员工薪资进行四舍五入和截断操作
SELECT employee_id, salary, ROUND(salary, 0) AS rounded_salary, TRUNC(salary, 0) AS truncated_salary
FROM employees;

解释:

ROUND(salary, 0)：将 salary 四舍五入到最近的整数。
TRUNC(salary, 0)：将 salary 截断到整数部分。

Oracle 提供了丰富的 SQL 函数和功能，远不仅限于上述列举的函数。以下是一些补充的高级函数和功能，涵盖了更多的应用场景和需求：

九、更多高级函数和功能

9.1 XML 函数

功能: 用于处理 XML 数据。

9.1.1 XMLTABLE()

功能: 将 XML 数据映射到关系表中。

示例:

sql 复制代码

-- 将 XML 数据映射到表中
SELECT *
FROM XMLTABLE('/employees/employee'
PASSING XMLTYPE('<employees><employee><id>1</id><name>John</name></employee></employees>')
COLUMNS id NUMBER PATH 'id',
name VARCHAR2(50) PATH 'name');

解释:

XMLTABLE() 将 XML 数据转换为关系表格式，方便进行 SQL 查询。

9.1.2 XMLELEMENT()

功能: 创建 XML 元素。

示例:

sql 复制代码

-- 创建 XML 元素
SELECT XMLELEMENT("employee",
XMLFOREST(employee_id AS "id", first_name AS "first_name", last_name AS "last_name"))
FROM employees;

解释:

XMLELEMENT() 创建一个 XML 元素，可以用来生成 XML 数据。

9.1.3 XMLAGG()

功能: 将多个 XML 元素聚合成一个 XML 文档。

示例:

sql 复制代码

-- 将多个 XML 元素聚合成一个 XML 文档
SELECT XMLSERIALIZE(CONTENT XMLAGG(XMLELEMENT("employee", XMLFOREST(employee_id AS "id", first_name AS "name")))
AS CLOB)
FROM employees;

解释:

XMLAGG() 聚合 XML 元素为一个 XML 文档。

9.2 JSON 函数

功能: 用于处理 JSON 数据。

9.2.1 JSON_VALUE()

功能: 提取 JSON 数据中的单个值。

示例:

sql 复制代码

-- 从 JSON 数据中提取单个值
SELECT JSON_VALUE('{"employee": {"id": 1, "name": "John"}}', '$.employee.name') AS employee_name
FROM dual;

解释:

JSON_VALUE() 从 JSON 数据中提取指定路径的值。

9.2.2 JSON_QUERY()

功能: 提取 JSON 数据中的嵌套对象或数组。

示例:

sql 复制代码

-- 从 JSON 数据中提取嵌套对象
SELECT JSON_QUERY('{"employee": {"id": 1, "name": "John"}}', '$.employee') AS employee_object
FROM dual;

解释:

JSON_QUERY() 提取 JSON 数据中指定路径的对象或数组。

9.2.3 JSON_TABLE()

功能: 将 JSON 数据映射到关系表中。

示例:

sql 复制代码

-- 将 JSON 数据映射到关系表中
SELECT *
FROM JSON_TABLE(
'{"employees":[{"id":1,"name":"John"},{"id":2,"name":"Jane"}]}',
'$.employees[*]'
COLUMNS (
id FOR ORDINALITY,
employee_id NUMBER PATH '$.id',
employee_name VARCHAR2(50) PATH '$.name'
)
);

解释:

JSON_TABLE() 将 JSON 数据转换为表格格式，以便进行 SQL 查询。

9.3 数据库链接（Database Link）

功能: 用于跨数据库查询。

9.3.1 创建数据库链接

示例:

sql 复制代码

-- 创建数据库链接
CREATE DATABASE LINK my_link
CONNECT TO remote_user IDENTIFIED BY 'password'
USING 'remote_db';

解释:

创建数据库链接 my_link，允许在本地数据库中访问远程数据库 remote_db 中的数据。

9.3.2 跨数据库查询

示例:

sql 复制代码

-- 使用数据库链接查询远程数据库
SELECT * FROM employees@my_link;

解释:

使用 @my_link 语法访问远程数据库中的表。

9.4 物化视图（Materialized View）

功能: 存储查询结果以提高查询性能。

9.4.1 创建物化视图

示例:

sql 复制代码

-- 创建物化视图
CREATE MATERIALIZED VIEW emp_mv
BUILD IMMEDIATE
REFRESH FAST ON COMMIT
AS SELECT * FROM employees;

解释:

CREATE MATERIALIZED VIEW 创建一个物化视图 emp_mv，并定义了即时构建和提交时快速刷新策略。

9.4.2 刷新物化视图

示例:

sql 复制代码

-- 刷新物化视图
BEGIN
DBMS_MVIEW.REFRESH('emp_mv');
END;
/

解释:

使用 DBMS_MVIEW.REFRESH 存储过程手动刷新物化视图。

9.5 复杂聚合函数

9.5.1 LISTAGG()

功能: 聚合字符串数据到一个单一的字符串中。

示例:

sql 复制代码

-- 聚合员工名字为一个逗号分隔的字符串
SELECT department_id,
LISTAGG(first_name, ', ') WITHIN GROUP (ORDER BY first_name) AS all_names
FROM employees
GROUP BY department_id;

解释:

LISTAGG(first_name, ', ') WITHIN GROUP (ORDER BY first_name)：将 first_name 聚合为一个逗号分隔的字符串，并按 first_name 排序。

9.5.2 MODEL

功能: 在 SQL 查询中使用模型进行复杂的数据处理。

示例:

sql 复制代码

-- 使用 MODEL 进行复杂数据处理
SELECT * FROM (
SELECT department_id, salary
FROM employees
)
MODEL
PARTITION BY (department_id)
DIMENSION BY (ROWNUM AS rnum)
MEASURES (salary)
RULES
(
salary[rnum] = salary[rnum-1] * 1.1
);

解释:

MODEL 子句允许在查询中进行复杂的数学和逻辑操作，如将薪资增加 10%。

总结

本文详细探讨了 Oracle 数据库中各种高级函数和功能，这些工具和技术在复杂的数据操作和分析中扮演着关键角色。以下是对主要功能的总结：

分析函数 ：提供了强大的数据分析能力，如 RANK(), DENSE_RANK(), NTILE() 和 ROW_NUMBER()，用于计算排名、分组以及生成序列等，帮助用户在数据集内进行深度分析和排序。
窗口函数 ：允许在查询中对数据进行分区和排序，从而在计算中考虑特定的窗口或范围。这些函数包括 SUM() OVER(), AVG() OVER() 和 LEAD(), LAG()，用于计算移动总和、平均值以及前后行的值。
集合操作符 ：用于处理和组合多个查询结果，如 UNION, INTERSECT, MINUS，帮助用户合并、查找和排除重复数据，进行集合间的比较和操作。
递归查询 ：通过使用 WITH 子句进行递归查询，处理层次结构数据。CONNECT BY 子句和 START WITH 子句在处理树形数据结构时尤其有用，支持递归查询和数据的层次展示。
正则表达式函数 ：提供了强大的模式匹配和替换功能，包括 REGEXP_LIKE(), REGEXP_INSTR(), REGEXP_SUBSTR(), 和 REGEXP_REPLACE()，用于处理复杂的文本模式匹配和替换操作。
字符串函数 ：用于字符串的创建、处理和操作，涵盖 CONCAT(), SUBSTR(), INSTR(), LENGTH(), UPPER(), LOWER(), 和 TRIM() 等函数，帮助处理和格式化文本数据。
日期和时间函数 ：提供了丰富的日期和时间处理能力，如 SYSDATE, CURRENT_DATE, ADD_MONTHS(), MONTHS_BETWEEN(), NEXT_DAY(), 和 LAST_DAY()，用于计算和格式化日期和时间。
数学函数 ：用于执行各种数学运算，包括 ABS(), CEIL(), FLOOR(), MOD(), POWER(), SQRT(), EXP(), 和 LOG()，支持对数值进行精确计算和处理。
更多高级函数和功能 ：包括 XML 和 JSON 函数（如 XMLTABLE(), XMLELEMENT(), JSON_VALUE(), JSON_QUERY()），数据库链接功能，物化视图（如 CREATE MATERIALIZED VIEW），以及复杂聚合函数（如 LISTAGG() 和 MODEL 子句），这些功能扩展了 SQL 查询的能力，并支持跨数据库操作和数据建模。

这些高级函数和功能为处理复杂数据提供了强大的支持，能够满足各种分析和数据操作的需求。通过深入掌握这些工具，用户可以更加高效地进行数据查询和分析，优化数据库操作，提升工作效率。