OCP实验 | 03-SQL优化

OceanBase SQL 优化考试笔记

4、SQL 优化

4.1 统计信息默认选择率

核心概念

OceanBase 优化器两种估行方式

  • 基于选择率的行数估计
  • 基于存储层的行数估计

选择率

  • 选择率越低越好,数据唯一性越高越好
  • 选择率 = 查询返回行数 / 表总行数
  • 计算结果需要 ×100

NDV(Number of Distinct Values)

  • 某一列中不同值的数量
  • 用于优化器生成执行计划
选择率计算
sql 复制代码
-- 实际行数
SELECT COUNT(*) FROM t1 WHERE c1 = 10;  

-- 实际选择率
(查询返回行数) / (表总行数) × 100

预估选择率

  • EST.ROWS / table_rows
  • EXPLAIN EXTENDED 中的 OUTPUT_ROWS / table_rows
考试关键点
  • 无统计信息时,OB 默认 NDV=100
  • 等值查询默认选择率 = 0.01(1%)
  • 思考:3 条 SQL 预估行数 = 100,就是因为默认 NDV=100

4.2 统计信息采集相关表

自动采集(每日合并)
sql 复制代码
__all_virtual_meta_table
__all_virtual_column_statistic
手工收集(集群级 / MySQL 租户)
sql 复制代码
__all_virtual_table_stat_v2   / __all_table_stat_v2
__all_virtual_column_stat_v2  / __all_column_stat_v2
__all_virtual_histogram_stat_v2 / __all_histogram_stat_v2
手工采集(Oracle 租户级)
sql 复制代码
all_tab_statistics
all_tab_col_statistics
all_tab_histograms
连接/进程相关
sql 复制代码
oceanbase.__all_virtual_processlist  -- 集群租户
sys.all_virtual_processlist          -- Oracle sys 租户

4.3 SQL 优化(实操重点)

考试要求
  • 给定 SQL,从 9s → <1s
  • 必须查 plan_cache_plan_explain 查看真实执行计划
  • 直接 EXPLAIN 不得分
查看真实执行计划(必背)
sql 复制代码
SELECT 
  PLAN_DEPTH,PLAN_LINE_ID,OPERATOR,NAME,ROWS,COST 
FROM gv$plan_cache_plan_explain 
WHERE TENANT_ID=1002 
  AND ip='10.186.65.12' 
  AND port=2882 
  AND PLAN_ID=648 
ORDER BY PLAN_LINE_ID;
优化手段
  1. 调整驱动表 / JOIN 顺序
  2. 绑定 OUTLINE(固定执行计划)
  3. 添加 HINT
sql 复制代码
/*+ leading(a) use_nl(a,b,f) */
创建 Outline(固定执行计划)
sql 复制代码
CREATE OUTLINE outline2 
ON 'ED570339F2C856BA96008A29EDF04C74' 
USING HINT /*+ index(tbl1 idx_col2)*/;
查看 SQL 审计
sql 复制代码
gv$sql_audit

4.4 合并(Major Freeze)

合并操作命令
sql 复制代码
-- 暂停合并
ALTER SYSTEM SUSPEND MERGE;

-- 恢复合并
ALTER SYSTEM RESUME MERGE;

-- 发起一次合并(重要)
ALTER SYSTEM MAJOR FREEZE;
查询字段统计信息(多表关联)

考试场景 :做一次合并,查询某表 c2 字段统计信息

返回:table_name、column_name、num_distinct、min_value、max_value

sql 复制代码
USE oceanbase;

SELECT 
  t1.table_name,
  t2.column_name,
  t3.num_distinct,
  t3.min_value,
  t3.max_value
FROM __all_virtual_table t1
INNER JOIN __all_virtual_column t2 
  ON t1.tenant_id=t2.tenant_id AND t1.table_id=t2.table_id
INNER JOIN __all_virtual_column_statistic t3 
  ON t2.tenant_id=t3.tenant_id 
  AND t2.table_id=t3.table_id 
  AND t2.column_id=t3.column_id
WHERE t1.tenant_id=1003
  AND t1.table_name='goods_info'
  AND t2.column_name='goods_name';

4.5 收集统计信息

两种收集方式
sql 复制代码
ANALYZE TABLE
CALL dbms_stats.gather_table_stats
收集指定表/列统计信息
sql 复制代码
-- 收集指定列
CALL dbms_stats.gather_table_stats('tpcc','chap41', method_opt=>'for columns c3 size auto');

-- 收集所有列
CALL DBMS_STATS.GATHER_TABLE_STATS (
  'tpcc', 'chap41', 
  method_opt=>'FOR ALL COLUMNS SIZE AUTO', 
  granularity=>'ALL', 
  degree=>4
);
sql 复制代码
-- 收集直方图
ANALYZE TABLE tbl1 UPDATE HISTOGRAM ON a,b,c,d WITH 30 BUCKETS;

ANALYZE TABLE t1 UPDATE HISTOGRAM ON c1 WITH 30 BUCKETS;
查询统计信息
sql 复制代码
-- 查询 table_id
SELECT * FROM gv$table WHERE tenant_id=1003 AND table_name='t_user_transaction'\G;

-- 查询列级统计信息
SELECT * FROM __all_virtual_column_stat_v2 WHERE table_id='1101710651081564'\G

相关推荐
Nturmoils11 小时前
订单列表慢查询,先看 WHERE、ORDER BY 和 LIMIT
数据库
渣波15 小时前
拒绝 SQL 焦虑!手把手带你用 NestJS + Prisma + DTO 写出“防弹”级后端代码
javascript·数据库·后端
倔强的石头_2 天前
KingbaseES 新版MySQL 兼容版体验:旧版迁移 + 功能实测
数据库
zzzzzz3103 天前
9K Star 炸裂开源!这个 C 语言写的代码知识图谱,把 Linux 内核索引压缩到了 3 分钟
linux·服务器·sql
倔强的石头_5 天前
《Kingbase护城河》——数据库存储空间全景探测与精细化瘦身实战
数据库
云技纵横5 天前
唯一索引 INSERT 死锁实战:5 秒复现交叉插入的 S 锁循环等待
sql·mysql
冬奇Lab5 天前
每日一个开源项目(第134篇):Zvec - 阿里开源的嵌入式向量数据库,向量搜索界的 SQLite
数据库·人工智能·llm
ClouGence6 天前
Oracle CDC 架构优化:从主库直连到 DataGuard 备库同步
数据库·后端·oracle
无响应de神6 天前
三、用户与权限管理
数据库·mysql
麦聪聊数据6 天前
数据服务化时代:企业数据能力输出的核心路径
数据库