达梦统计信息

统计信息

统计信息概述

统计信息是数据库中关于表和索引数据的元信息,用于描述数据的分布、唯一性、大小等特征。数据库优化器依赖统计信息来选择最优的执行计划。统计信息对于 CBO(基于代价的优化器)生成执行计划具有直接影响。

收集统计信息

dm收集统计信息的三种方法:

• 使用dbms_stats包收集

• 使用stat on语句收集

• 使用sp_stat函数收集

--dbms_stats 支持对模式下对象、单个表、单个索引收集统计信息,指定采样率

dbms_stats.gather_table_stats('DMTEST','T_TESTTAB',ESTIMATE_PERCENT=>100);

--查询sp_stat相关的函数

select name from v$ifun t where name like 'SP%_STAT%_INIT';

--stat 语句支持对表、索引、列收集统计信息

stat 100 on dmtest.t_testtab(userid);

DM 收集统计信息的方法分为手动收集和自动收集。

手动收集

--收集指定用户下所有表所有列的统计信息:

DBMS_STATS.GATHER_SCHEMA_STATS('username',100,TRUE,'FOR ALL COLUMNS SIZE AUTO');

--收集指定用户下所有索引的统计信息:

DBMS_STATS.GATHER_SCHEMA_STATS('usename',1.0,TRUE,'FOR ALL INDEXED SIZE AUTO');

--或 收集单个索引统计信息:

DBMS_STATS.GATHER_INDEX_STATS('username','IDX_T2_X');

--收集指定用户下某表统计信息:

DBMS_STATS.GATHER_TABLE_STATS('username','table_name',null,100,TRUE,'FOR ALL COLUMNS SIZE AUTO');

--收集某表某列的统计信息:

STAT 100 ON table_name(column_name);

自动收集

DM支持统计信息的自动收集,当全表数据量变化超过设定阈值后可自动更新统计信息

--打开表数据量监控开关,参数值为 1 时监控所有表,2 时仅监控配置表

SP_SET_PARA_VALUE(1,'AUTO_STAT_OBJ',2);

--设置 SYSDBA.T 表数据变化率超过 15% 时触发自动更新统计信息

DBMS_STATS.SET_TABLE_PREFS('SYSDBA','T','STALE_PERCENT',15);

--配置自动收集统计信息触发时机

SP_CREATE_AUTO_STAT_TRIGGER(1, 1, 1, 1,'14:36', '2020/3/31',60,1);

/*

函数各参数介绍

SP_CREATE_AUTO_STAT_TRIGGER(

TYPE INT, --间隔类型,默认为天

FREQ_INTERVAL INT, --间隔频率,默认 1

FREQ_SUB_INTERVAL INT, --间隔频率,与 FREQ_INTERVAL 配合使用

FREQ_MINUTE_INTERVAL INT, --间隔分钟,默认为 1440

STARTTIME VARCHAR(128), --开始时间,默认为 22:00

DURING_START_DATE VARCHAR(128), --重复执行的起始时间,默认 1900/1/1

MAX_RUN_DURATION INT, --允许的最长执行时间(秒),默认不限制

ENABLE INT --0 关闭,1 启用 --默认为 1

);

*/

统计信息的基本操作

查看统计信息

--用于经过 GATHER_TABLE_STATS、GATHER_INDEX_STATS 或 GATHER_SCHEMA_STATS 收集之后展示。

dbms_stats.table_stats_show('模式名','表名');

--用于经过 GATHER_TABLE_STATS、GATHER_INDEX_STATS 或 GATHER_SCHEMA_STATS 收集之后展示。 返回两个结果集:一个是索引的统计信息;另一个是直方图的统计信息。

dbms_stats.index_stats_show('模式名','索引名');

--用于经过 GATHER_TABLE_STATS、GATHER_INDEX_STATS 或 GATHER_SCHEMA_STATS 收集之后展示。

dbms_stats.COLUMN_STATS_SHOW('模式名','表名','列名');

更新统计信息

--更新已有统计信息

DBMS_STATS.UPDATE_ALL_STATS();

删除统计信息

--表

DBMS_STATS.DELETE_TABLE_STATS('模式名','表名','分区名',...);

--模式

DBMS_STATS.DELETE_SCHMA_STATS('模式名','','',...);

--索引

DBMS_STATS.DELETE_INDEX_STATS('模式名','索引名','分区表名',...);

--字段

DBMS_STATS.DELETE_COLUMN_STATS('模式名','表名','列名','分区表名',...);

测试用例

表数据量大幅变化后未更新统计信息

创建测试表并插入初始数据

CREATE TABLE test_employees (

emp_id INT,

dept_id INT,

emp_name VARCHAR(50)

);

-- 插入 1000 条数据,dept_id 均匀分布(1~10)

INSERT INTO test_employees

SELECT LEVEL, MOD(LEVEL, 10) + 1, 'EMP_' || LEVEL

FROM DUAL CONNECT BY LEVEL <= 1000;

-- 创建非唯一索引

CREATE INDEX idx_dept ON test_employees(dept_id);

收集统计信息

DBMS_STATS.GATHER_TABLE_STATS('SYSDBA', 'TEST_EMPLOYEES', NULL, 100);

查看执行计划(正确使用索引)

EXPLAIN SELECT * FROM test_employees WHERE dept_id = 5;

预期:INDEX RANGE SCAN(dept_id=5 筛选约 100 行)

插入倾斜数据(不更新统计信息)

-- 插入 100000 条数据,dept_id 全部为 5

INSERT INTO test_employees

SELECT 1000 + LEVEL, 5, 'EMP_' || (1000 + LEVEL)

FROM DUAL CONNECT BY LEVEL <= 100000;

再次执行查询(CBO 错误选择索引扫描)

EXPLAIN SELECT * FROM test_employees WHERE dept_id = 5;

-- 实际结果:INDEX RANGE SCAN

-- 预期问题:CBO 仍认为 dept_id=5 仅有约 100 行,实际有 100100 行。

更新统计信息并验证

-- 预期修正:TABLE FULL SCAN(因 dept_id=5 数据量过大,全表扫描更优)

索引创建后未更新统计信息

创建测试表并插入数据

CREATE TABLE test_products (

product_id INT,

product_name VARCHAR(50),

category_id INT

);

INSERT INTO test_products

SELECT LEVEL, 'Product_' || LEVEL, MOD(LEVEL, 10)

FROM DUAL CONNECT BY LEVEL <= 100000;

收集统计信息

DBMS_STATS.GATHER_TABLE_STATS('SYSDBA', 'TEST_PRODUCTS', NULL, 100);

创建索引但不更新统计信息

CREATE INDEX idx_category_id ON test_products(category_id);

查看执行计划

EXPLAIN SELECT * FROM test_products WHERE category_id = 5;

--预期选择全表扫描,结果是优化器正确选择索引扫描

更新统计信息后验证

--优化器依然正确选择索引扫描

更多详细资料可前往达梦社区:https://eco.dameng.com

相关推荐
小安同学iter22 分钟前
SpringBoot (二) 日志系统
数据库·spring boot·后端
Chandler2428 分钟前
Redis:事务
数据库·redis·缓存
是阿建吖!1 小时前
【MySQL】事务
数据库·mysql
Asuka072 小时前
MySQL数据库和表的操作
数据库·mysql
天上掉下来个程小白2 小时前
Redis-04.Redis常用命令-字符串常用命令
java·数据库·redis·springboot·苍穹外卖
2401_891409263 小时前
国外期货高频数据:历史高频分钟回测数据分享
数据库·金融
喻师傅3 小时前
横扫SQL面试——用户留存率问题
数据库·sql·面试
暗恋 懒羊羊3 小时前
【MySQL】表的操作
数据库·mysql
likfishdn3 小时前
SQL注入零基础学习二MYSQL手工注入
数据库·sql·学习
Databend3 小时前
Databend 产品月报(2025年3月)
数据库