oracle 列的直方图

一、4 种直方图类型(核心说明)

【NONE(无直方图)】

适用版本:所有 Oracle 版本

核心逻辑:不统计数据分布,优化器默认按 "均匀分布" 估算行数

适用场景:数据均匀的列(如员工 ID、订单号),无需精准分布统计

关键特点:统计成本最低,无需额外计算资源

【FREQUENCY(频率直方图)】

适用版本:所有 Oracle 版本

核心逻辑:每个唯一值单独建桶(最多 254 个),精准统计每个值的出现次数

适用场景:唯一值少(≤254 个)的列(如性别、学历、部门编码)

关键特点:高频值统计精准,唯一值超 254 个时失效

【HEIGHT BALANCED(高度均衡直方图)】

适用版本:所有 Oracle 版本

核心逻辑:分成最多 254 个桶,每个桶内行数大致相等

适用场景:唯一值多(>254 个)且无明显高频值的列(如普通工资列)

关键特点:覆盖大范围值,无法精准体现单个高频值

【HYBRID(混合直方图)】

适用版本:Oracle 12c 及以上

核心逻辑:高频值单独建桶(按 FREQUENCY),低频值合并建桶(按 HEIGHT BALANCED)

适用场景:唯一值多 + 长尾分布的列(如用户活跃度、商品销量)

关键特点:兼顾精准度和覆盖面,12c + 默认类型

二、类型对比(纯文本清晰版)

类型 适用版本 核心逻辑 适用场景 关键特点NONE(无直方图) 所有版本 不统计分布,默认均匀分布 数据均匀列(ID / 订单号)、无需精准统计 统计成本最低FREQUENCY(频率) 所有版本 每个唯一值 1 个桶(≤254),精准统计次数 唯一值少(≤254)的列(性别 / 部门) 高频值精准,超 254 唯一值失效HEIGHT BALANCED 所有版本 最多 254 桶,每桶行数大致相等 唯一值多(>254)且无明显高频值的列 覆盖广,单个高频值统计模糊HYBRID(混合) 12c+ 高频值单独建桶,低频值合并建桶 唯一值多 + 长尾分布列(销量 / 活跃度) 兼顾精准与覆盖,12c + 默认

三、直方图收集命令(直接复制可用)

自动匹配最优类型(12c + 优先 HYBRID)EXEC DBMS_STATS.GATHER_TABLE_STATS (ownname => ' 你的用户名 ', -- 替换为实际用户名(如 SCOTT)tabname => ' 你的表名 ', -- 替换为实际表名(如 EMP)method_opt => 'FOR ALL COLUMNS SIZE AUTO');

仅对数据倾斜列生成直方图EXEC DBMS_STATS.GATHER_TABLE_STATS (ownname => ' 你的用户名 ',tabname => ' 你的表名 ',method_opt => 'FOR ALL COLUMNS SIZE SKEWONLY');

强制生成 FREQUENCY 直方图(唯一值≤254 时生效)EXEC DBMS_STATS.GATHER_TABLE_STATS (ownname => ' 你的用户名 ',tabname => ' 你的表名 ',method_opt => 'FOR ALL COLUMNS SIZE 254');

禁用直方图(设为 NONE)EXEC DBMS_STATS.GATHER_TABLE_STATS (ownname => ' 你的用户名 ',tabname => ' 你的表名 ',method_opt => 'FOR ALL COLUMNS SIZE 1');

四、查看直方图状态的 SQL

查当前用户表的所有列直方图类型SELECTtable_name, -- 表名column_name, -- 列名histogram -- 结果:NONE/FREQUENCY/HEIGHT BALANCED/HYBRIDFROM USER_TAB_COL_STATISTICSWHERE table_name = ' 你的表名 '; -- 替换为实际表名(大写)

查所有用户表的直方图类型(需 DBA 权限)SELECTowner, -- 用户名table_name, -- 表名column_name, -- 列名histogram -- 直方图类型FROM DBA_TAB_COL_STATISTICSWHERE table_name = ' 你的表名 '; -- 替换为实际表名(大写)

查指定列的直方图分布详情SELECTtable_name,column_name,endpoint_value AS 列值,endpoint_number AS 累计行数FROM USER_HISTOGRAMSWHERE table_name = ' 你的表名 'AND column_name = ' 你的列名 'ORDER BY endpoint_number;

五、实用使用建议

12c + 版本直接用「SIZE AUTO」,Oracle 自动匹配最优类型,无需手动干预

唯一值少 + 高频集中的列(如性别),用「SIZE 254」强制 FREQUENCY,统计更准

唯一值多 + 无高频值的列(如时间戳),保持 NONE 或用 HEIGHT BALANCED,减少开销

收集后通过「USER_HISTOGRAMS」验证分布,避免统计偏差导致 SQL 执行计划低效

相关推荐
IT龟苓膏9 小时前
Redis 数据类型底层原理:SDS、quicklist、intset、skiplist、Bitmap、HyperLogLog 一篇讲清
数据库·redis·skiplist
流星白龙9 小时前
【MySQL高阶】19.变更缓冲区,自适应哈希索引,日志缓冲区
数据库·windows·mysql
晴天¥9 小时前
Oracle中的监听配置与管理(动态、静态监听配置对比以及listener.ora和tnsnames.ora)
数据库·oracle
持敬chijing10 小时前
Web渗透之SQL注入-文件读写-木马植入
sql·安全·web安全·网络安全·安全威胁分析
瀚高PG实验室10 小时前
python连接HGDB超时
数据库·瀚高数据库·highgo
jnrjian10 小时前
ddl_lock_timeout 设置 read only table 通过view 实现细粒度依赖
sql·oracle
闪电悠米11 小时前
黑马点评-Redisson-01_why_redisson
java·服务器·网络·数据库·缓存·wpf
Counter-Strike大牛11 小时前
SpringBoot2.7.10+MyBatisPlus实现MySQL+DM双数据库切换
数据库·mysql
dllxhcjla12 小时前
Redis
数据库·redis·缓存
睡不醒男孩03082312 小时前
数据库高可用运维实操指南:基于CLup的PostgreSQL生产环境自动化管理
运维·数据库·postgresql