【数据库】【Oracle】分区表与大表设计

Oracle 分区表与大表设计完全指南

分区表是 Oracle 管理海量数据（TB级）的核心武器，通过"分而治之"策略，将大表物理切分为更小、更易管理的片段，同时保持逻辑上的单一表。

一、分区核心价值与适用场景

1.1 分区解决的痛点

问题	分区前	分区后
查询性能	全表扫描百万/千万行	仅扫描相关分区（分区剪枝）
数据维护	DELETE/UPDATE 锁全表	仅操作目标分区，锁粒度小
备份恢复	整表备份，恢复缓慢	可单独备份/恢复关键分区
数据老化	DELETE 历史数据慢	快速 DROP/TRUNCATE 分区
索引管理	索引重建耗时数小时	按分区独立重建，时间缩短90%
并发性能	热点数据集中	分散到不同分区，减少争用

1.2 何时需要分区

✅ 表大小 > 2GB （官方建议）

✅ 历史数据需定期清理 （如日志、交易）

✅ 查询总是带时间/区域等范围条件

✅ 维护窗口短 ，无法整表维护

✅ 高并发 INSERT，需分散热点块

不适用场景 ：

❌ 小表（< 1GB）

❌ 频繁全表扫描 （分区反而增加开销）

❌ 随机点查询 （无法利用分区剪枝）

❌ 无明确分区键

二、分区类型详解

2.1 RANGE 分区（最常用）

按连续范围分区：时间、ID、数值

sql 复制代码

-- 示例1：按销售日期分区（创建时指定分区）
CREATE TABLE sales_range (
    sale_id NUMBER,
    sale_date DATE NOT NULL,
    amount NUMBER
)
PARTITION BY RANGE (sale_date) (
    PARTITION p2023_q1 VALUES LESS THAN (DATE '2023-04-01'),
    PARTITION p2023_q2 VALUES LESS THAN (DATE '2023-07-01'),
    PARTITION p2023_q3 VALUES LESS THAN (DATE '2023-10-01'),
    PARTITION p2023_q4 VALUES LESS THAN (DATE '2024-01-01'),
    PARTITION pmax VALUES LESS THAN (MAXVALUE)  -- 兜底分区
);

-- 示例2：INTERVAL 自动分区（11g+ 强烈推荐）
CREATE TABLE sales_interval (
    sale_id NUMBER,
    sale_date DATE NOT NULL,
    amount NUMBER
)
PARTITION BY RANGE (sale_date)
INTERVAL (NUMTOYMINTERVAL(1, 'MONTH'))  -- 每月自动创建分区
STORE IN (ts1, ts2, ts3, ts4)  -- 分区存储到不同表空间
(
    PARTITION p_initial VALUES LESS THAN (DATE '2023-01-01')
);

-- 插入数据自动创建分区
INSERT INTO sales_interval VALUES (1, DATE '2023-06-15', 1000);
-- 自动创建 SYS_P001 分区（2023-06-01 到 2023-07-01）

RANGE 分区查询优化：

sql 复制代码

-- 分区剪枝：仅扫描 p2023_q1 分区
SELECT * FROM sales_range 
WHERE sale_date BETWEEN DATE '2023-01-01' AND DATE '2023-03-31';

-- 查看分区剪枝（执行计划显示 PARTITION RANGE SINGLE）
EXPLAIN PLAN FOR 
SELECT * FROM sales_range PARTITION (p2023_q1) WHERE amount > 100;

2.2 LIST 分区（离散值）

按离散的值列表分区：地区、类型、状态

sql 复制代码

CREATE TABLE customers_list (
    customer_id NUMBER,
    region VARCHAR2(50),
    customer_name VARCHAR2(100)
)
PARTITION BY LIST (region) (
    PARTITION p_north VALUES ('北京', '天津', '河北'),
    PARTITION p_east VALUES ('上海', '江苏', '浙江'),
    PARTITION p_south VALUES ('广东', '广西', '海南'),
    PARTITION p_west VALUES ('四川', '云南', '贵州'),
    PARTITION p_default VALUES (DEFAULT)  -- 其他值
);

-- 查询特定分区
SELECT * FROM customers_list PARTITION (p_east) WHERE customer_name LIKE '张%';

2.3 HASH 分区（散列分布）

按哈希函数分散数据：高并发插入、无明确范围

sql 复制代码

CREATE TABLE orders_hash (
    order_id NUMBER PRIMARY KEY,
    order_date DATE,
    customer_id NUMBER
)
PARTITION BY HASH (order_id)  -- 按订单ID哈希
PARTITIONS 16                 -- 创建16个分区
STORE IN (ts1, ts2, ts3, ts4);  -- 分布到4个表空间

-- 分区名自动生成：SYS_P001 到 SYS_P016
-- 优势：并发 INSERT 分散到不同分区，减少热点块争用

HASH 分区数量选择：

2 的幂次方（4, 8, 16, 32, 64）
根据并发度和存储节点数决定

2.4 复合分区（Composite Partitioning）

分区 + 子分区：RANGE-LIST、RANGE-HASH、LIST-RANGE

sql 复制代码

-- RANGE-LIST：按时间分区，按地区子分区
CREATE TABLE sales_range_list (
    sale_id NUMBER,
    sale_date DATE,
    region VARCHAR2(50),
    amount NUMBER
)
PARTITION BY RANGE (sale_date)
SUBPARTITION BY LIST (region) (
    PARTITION p2023_q1 VALUES LESS THAN (DATE '2023-04-01') (
        SUBPARTITION p2023_q1_north VALUES ('北京', '天津'),
        SUBPARTITION p2023_q1_east VALUES ('上海', '江苏'),
        SUBPARTITION p2023_q1_default VALUES (DEFAULT)
    ),
    PARTITION p2023_q2 VALUES LESS THAN (DATE '2023-07-01') (
        SUBPARTITION p2023_q2_north VALUES ('北京', '天津'),
        SUBPARTITION p2023_q2_east VALUES ('上海', '江苏'),
        SUBPARTITION p2023_q2_default VALUES (DEFAULT)
    )
);

-- 查询可剪枝到子分区
SELECT * FROM sales_range_list 
WHERE sale_date = DATE '2023-02-15' AND region = '上海';
-- 仅扫描 p2023_q1_east 子分区

2.5 引用分区（Reference Partitioning）

子表继承父表分区键（11g+）

sql 复制代码

-- 父表
CREATE TABLE orders_ref (
    order_id NUMBER PRIMARY KEY,
    order_date DATE NOT NULL
)
PARTITION BY RANGE (order_date) (
    PARTITION p2023_q1 VALUES LESS THAN (DATE '2023-04-01'),
    PARTITION p2023_q2 VALUES LESS THAN (DATE '2023-07-01')
);

-- 子表（通过外键引用分区）
CREATE TABLE order_items_ref (
    item_id NUMBER PRIMARY KEY,
    order_id NUMBER NOT NULL,
    product_id NUMBER,
    quantity NUMBER,
    CONSTRAINT fk_order_items 
        FOREIGN KEY (order_id) 
        REFERENCES orders_ref(order_id)
)
PARTITION BY REFERENCE (fk_order_items);  -- 继承父表分区

-- 优势：订单表分区删除时，订单明细自动同步
ALTER TABLE orders_ref DROP PARTITION p2023_q1;  -- 自动级联删除子表分区

2.6 间隔分区（Interval）高级特性

多列间隔分区（21c+）：

sql 复制代码

CREATE TABLE sales_multi_interval (
    sale_id NUMBER,
    sale_date DATE,
    region_id NUMBER
)
PARTITION BY RANGE (sale_date, region_id)
INTERVAL (NUMTOYMINTERVAL(1, 'MONTH'), 1)  -- 每月+每个region自动分区
(
    PARTITION p_initial VALUES LESS THAN (DATE '2023-01-01', 0)
);

转换为间隔分区：

sql 复制代码

-- 将普通 RANGE 分区转为自动分区
ALTER TABLE sales_range SET INTERVAL (NUMTOYMINTERVAL(1, 'MONTH'));

三、分区索引策略

3.1 本地分区索引（Local Partitioned Index）

索引分区与表分区一一对应（推荐）

sql 复制代码

CREATE INDEX idx_sales_date_local ON sales_range(sale_date) LOCAL;

-- 每个分区自动创建对应索引分区
-- 分区表删除/截断时，索引自动维护（无需重建）

本地前缀索引 vs 非前缀索引：

sql 复制代码

-- 前缀索引：分区键在索引列最左
CREATE INDEX idx_sales_date_amount ON sales_range(sale_date, amount) LOCAL;
-- 查询 WHERE sale_date = ... AND amount = ... 可剪枝

-- 非前缀索引：分区键不在最左
CREATE INDEX idx_sales_amount_date ON sales_range(amount, sale_date) LOCAL;
-- 查询 WHERE amount = ... 需扫描所有分区索引（性能差）

3.2 全局分区索引（Global Partitioned Index）

索引分区与表分区结构独立

sql 复制代码

-- 全局范围索引（按 amount 分区）
CREATE INDEX idx_sales_amount_global ON sales_range(amount)
GLOBAL PARTITION BY RANGE (amount) (
    PARTITION p_low VALUES LESS THAN (1000),
    PARTITION p_medium VALUES LESS THAN (10000),
    PARTITION p_high VALUES LESS THAN (MAXVALUE)
);

-- 适用：查询条件与表分区键不同
-- 代价：表分区 DDL 操作需重建全局索引（除非加 UPDATE GLOBAL INDEXES）

3.3 全局非分区索引

sql 复制代码

CREATE INDEX idx_sales_id_global ON sales_range(sale_id);

-- 适用：主键/唯一键
-- 缺点：分区 DDL 会失效（需重建）

四、分区维护操作

4.1 分区管理

添加分区：

sql 复制代码

-- RANGE 手动添加
ALTER TABLE sales_range ADD PARTITION p2024_q1 
VALUES LESS THAN (DATE '2024-04-01');

-- INTERVAL 自动添加（无需手动）

分裂分区：

sql 复制代码

-- 将 p2023_q4 分裂为 10-11月 和 12月
ALTER TABLE sales_range SPLIT PARTITION p2023_q4 AT (DATE '2023-12-01') 
INTO (PARTITION p2023_q4_oct_nov, PARTITION p2023_q4_dec);

合并分区：

sql 复制代码

-- 合并相邻分区
ALTER TABLE sales_range MERGE PARTITIONS p2023_q1, p2023_q2 
INTO PARTITION p2023_h1;

交换分区（快速加载）：

sql 复制代码

-- 将普通表数据交换到分区（秒级）
CREATE TABLE sales_temp AS SELECT * FROM sales_range WHERE 1=0;

-- 加载数据到临时表
INSERT INTO sales_temp SELECT * FROM external_data;

-- 交换分区（无数据移动，仅元数据变更）
ALTER TABLE sales_range EXCHANGE PARTITION p2023_q1 
WITH TABLE sales_temp INCLUDING INDEXES;

4.2 分区数据清理

截断分区（瞬间完成）：

sql 复制代码

-- 删除历史数据（比分区快得多）
ALTER TABLE sales_range TRUNCATE PARTITION p2023_q1;

删除分区：

sql 复制代码

ALTER TABLE sales_range DROP PARTITION p2023_q1 
UPDATE GLOBAL INDEXES;  -- 自动维护全局索引

4.3 查询分区信息

sql 复制代码

-- 查询分区表信息
SELECT table_name, partitioning_type, partition_count
FROM user_part_tables;

-- 查询分区信息
SELECT partition_name, high_value, num_rows
FROM user_tab_partitions
WHERE table_name = 'SALES_RANGE'
ORDER BY partition_position;

-- 查询子分区
SELECT partition_name, subpartition_name, num_rows
FROM user_tab_subpartitions
WHERE table_name = 'SALES_RANGE_LIST';

五、大表设计最佳实践

5.1 分区键选择策略

时间维度（最常见）：

sql 复制代码

-- 交易流水、日志
PARTITION BY RANGE (create_date) INTERVAL (NUMTOYMINTERVAL(1, 'DAY'))

业务维度：

sql 复制代码

-- 多租户系统
PARTITION BY LIST (tenant_id) (
    PARTITION p_tenant_a VALUES ('TENANT_A'),
    PARTITION p_tenant_b VALUES ('TENANT_B')
);

ID 哈希：

sql 复制代码

-- 高并发写入
PARTITION BY HASH (order_id) PARTITIONS 64

5.2 大表设计清单

✅ 分区键必须出现在查询条件中 （否则无法剪枝）

✅ 历史数据分区设为只读（节省备份时间）：

sql 复制代码

ALTER TABLE sales_range MODIFY PARTITION p2022_q1 READ ONLY;

✅ 不同分区存储到不同表空间（平衡 I/O）：

sql 复制代码

PARTITION BY RANGE (sale_date) (
    PARTITION p2023_q1 VALUES LESS THAN (...) TABLESPACE ts_hot,
    PARTITION p2023_q2 VALUES LESS THAN (...) TABLESPACE ts_warm,
    PARTITION p2023_q3 VALUES LESS THAN (...) TABLESPACE ts_cold
);

✅ 定期归档历史分区（压缩节省空间）：

sql 复制代码

-- 压缩历史分区
ALTER TABLE sales_range MOVE PARTITION p2022_q1 COMPRESS FOR QUERY;

-- 查询压缩率
SELECT partition_name, compression, compress_for, num_rows, blocks
FROM user_tab_partitions
WHERE table_name = 'SALES_RANGE';

✅ 大表避免全局索引（DDL 代价高）

5.3 陷阱规避

❌ 分区键使用函数（无法剪枝）：

sql 复制代码

-- 错误
SELECT * FROM sales_range WHERE TO_CHAR(sale_date, 'YYYY') = '2023';

-- 正确
SELECT * FROM sales_range WHERE sale_date >= DATE '2023-01-01' AND sale_date < DATE '2024-01-01';

❌ 分区过多（增加元数据开销，建议 < 10000 个分区）

❌ 分区键更新（会导致行迁移，需使用 ENABLE ROW MOVEMENT）：

sql 复制代码

ALTER TABLE sales_range ENABLE ROW MOVEMENT;  -- 允许分区键更新

六、性能对比案例

案例：10亿行订单表优化

场景：查询 2023年6月某用户的订单

未分区表：

sql 复制代码

-- 全表扫描 10亿行，耗时 120秒
SELECT * FROM orders WHERE user_id = 10001 AND order_date BETWEEN '2023-06-01' AND '2023-06-30';
-- 执行计划：TABLE ACCESS FULL

分区表（RANGE + HASH 组合）：

sql 复制代码

CREATE TABLE orders_partitioned (
    order_id NUMBER,
    user_id NUMBER,
    order_date DATE,
    amount NUMBER
)
PARTITION BY RANGE (order_date) INTERVAL (NUMTOYMINTERVAL(1, 'MONTH'))
SUBPARTITION BY HASH (user_id) SUBPARTITIONS 16
(
    PARTITION p_initial VALUES LESS THAN (DATE '2023-01-01')
);

查询性能：

sql 复制代码

SELECT * FROM orders_partitioned 
WHERE user_id = 10001 
AND order_date BETWEEN DATE '2023-06-01' AND DATE '2023-06-30';

-- 执行计划：
-- PARTITION RANGE SINGLE                    -- 剪枝到 1 个分区
--   PARTITION HASH SINGLE                   -- 剪枝到 1 个子分区
--     TABLE ACCESS BY LOCAL INDEX ROWID     -- 仅扫描 1/256 数据
--       INDEX RANGE SCAN IDX_USER_ID_LOCAL

-- 耗时：0.5秒（性能提升 240倍）

七、总结

分区设计决策树

复制代码

表 > 2GB？ → 是 → 查询是否带时间/范围条件？ → 是 → RANGE + INTERVAL
                                          ↓否
                                  是否按离散值查询？ → 是 → LIST
                                          ↓否
                                  是否高并发写入？ → 是 → HASH
                                          ↓否
                                  是否需要多维度？ → 是 → COMPOSITE
                                          ↓否
                                不建分区或单分区

分区维护最佳实践

维护场景	操作命令	影响
删除旧数据	`DROP/TRUNCATE PARTITION`	秒级
加载新数据	`EXCHANGE PARTITION`	秒级（元数据变更）
重建索引	`ALTER INDEX ... REBUILD PARTITION`	单个分区，影响小
备份	备份活跃分区	节省 80% 备份时间
压缩	`MOVE PARTITION COMPRESS`	节省 50-90% 空间

核心原则

✅ 分区键必须能剪枝 （90% 查询包含分区键）

✅ 优先本地索引 ，慎用全局索引

✅ INTERVAL 自动分区 （21c+）

✅ 子分区打散热点 （HASH 子分区）

✅ 历史分区只读/压缩

分区表设计是 Oracle 大表管理的艺术，需要根据业务特点、查询模式、数据生命周期综合权衡。没有银弹，只有最适合的方案。