PostgreSQL 之 BRIN 索引应用场景

PostgreSQL BRIN 索引应用场景

核心适用条件（先判断能不能用）

复制代码

✅ 表非常大（千万行以上，亿级最佳）
✅ 列值与数据写入的物理顺序高度相关
✅ 查询以"范围过滤"为主，不需要精确定位单行
✅ 磁盘空间或写入性能敏感

场景一：时间序列日志表 ⭐ 最典型

sql 复制代码

-- 系统访问日志，按时间顺序写入，数据量极大
CREATE TABLE access_log (
    id         BIGSERIAL PRIMARY KEY,
    user_id    BIGINT,
    url        TEXT,
    status     INT,
    created_at TIMESTAMPTZ DEFAULT now()
);

-- ✅ 用 BRIN，索引只有几百KB，哪怕表有10亿行
CREATE INDEX idx_access_log_brin ON access_log USING BRIN (created_at);

-- 查某天的日志
SELECT * FROM access_log
WHERE created_at BETWEEN '2024-03-01' AND '2024-03-02';

为什么有效：日志按时间顺序写入，物理块1 = 最早的数据，物理块N = 最新数据，BRIN 能精准跳过无关块。

场景二：IoT / 传感器数据

sql 复制代码

CREATE TABLE sensor_data (
    sensor_id   INT,
    temperature FLOAT,
    humidity    FLOAT,
    recorded_at TIMESTAMPTZ DEFAULT now()
);

CREATE INDEX idx_sensor_brin ON sensor_data USING BRIN (recorded_at);

-- 查某段时间内某传感器的数据
SELECT * FROM sensor_data
WHERE recorded_at > now() - INTERVAL '7 days'
AND sensor_id = 42;

传感器数据天然按时间堆积，BRIN 几乎是最优选择。

场景三：金融流水 / 订单表

sql 复制代码

CREATE TABLE order_flow (
    id          BIGSERIAL PRIMARY KEY,
    order_no    VARCHAR(32),
    amount      NUMERIC(18,2),
    created_at  TIMESTAMPTZ DEFAULT now()
);

-- 自增ID 和 created_at 都可以建 BRIN
CREATE INDEX idx_order_id_brin   ON order_flow USING BRIN (id);
CREATE INDEX idx_order_time_brin ON order_flow USING BRIN (created_at);

-- 按月查账单
SELECT sum(amount) FROM order_flow
WHERE created_at BETWEEN '2024-01-01' AND '2024-02-01';

场景四：数据仓库 / 历史归档表

sql 复制代码

-- 历史数据归档表，只追加写入，几亿行
CREATE TABLE dw_sales_history (
    sale_date   DATE,
    region      VARCHAR(50),
    product_id  BIGINT,
    revenue     NUMERIC(18,2)
);

-- BRIN 索引极小，配合按 sale_date 查询非常高效
CREATE INDEX idx_dw_sales_brin ON dw_sales_history USING BRIN (sale_date);

-- 统计某季度数据
SELECT region, sum(revenue)
FROM dw_sales_history
WHERE sale_date BETWEEN '2024-01-01' AND '2024-03-31'
GROUP BY region;

场景五：自增主键的超大表辅助过滤

sql 复制代码

-- 超大表上，主键 B+Tree 已经很大了
-- 如果查询是大范围 ID 过滤（比如分片处理）
CREATE INDEX idx_events_id_brin ON events USING BRIN (id);

-- 批量处理：每次处理一段ID区间
SELECT * FROM events WHERE id BETWEEN 1000000 AND 2000000;

BRIN 参数调优：`pages_per_range`

sql 复制代码

-- 默认每128个块作为一组
-- 数据量极大时可以调大，索引更小但精度更低
-- 数据量较小时可以调小，精度更高
CREATE INDEX idx_log_brin ON access_log
USING BRIN (created_at)
WITH (pages_per_range = 64);   -- 更精细
-- 或
WITH (pages_per_range = 256);  -- 更省空间

❌ BRIN 不适合的场景（踩坑预防）

sql 复制代码

-- ❌ 随机写入的字段（没有物理顺序）
WHERE email = 'xxx@xxx.com'      -- 用 B+Tree

-- ❌ 需要精确查单行
WHERE id = 12345                 -- 用 B+Tree

-- ❌ 数据会被大量 UPDATE（破坏物理顺序）
UPDATE users SET score = ...     -- 用 B+Tree

-- ❌ 小表（BRIN 优势不明显，B+Tree 更好）
-- 表只有几十万行 → 直接用 B+Tree

各场景索引选型速查

场景	推荐索引
系统日志、访问记录（按时间写入）	BRIN
IoT / 传感器时序数据	BRIN
金融流水、订单（时间范围查询）	BRIN
数据仓库历史归档表	BRIN
普通业务表等值查询	B+Tree
全文检索、数组、JSONB	GIN
模糊查询 `LIKE '%xx%'`	GIN + pg_trgm

一句话总结

BRIN 的黄金场景 = 超大表 + 数据按时间/自增顺序写入 + 以时间范围查询为主。

满足这三点，BRIN 能用不到 B+Tree 1% 的索引空间，达到接近甚至更好的查询性能。

PostgreSQL 之 BRIN 索引应用场景

PostgreSQL BRIN 索引应用场景

核心适用条件（先判断能不能用）

场景一：时间序列日志表 ⭐ 最典型

场景二：IoT / 传感器数据

场景三：金融流水 / 订单表

场景四：数据仓库 / 历史归档表

场景五：自增主键的超大表辅助过滤

BRIN 参数调优：pages_per_range

❌ BRIN 不适合的场景（踩坑预防）

各场景索引选型速查

一句话总结

BRIN 参数调优：`pages_per_range`