GaussDB分布式数据倾斜处理

python 复制代码
常规数据倾斜巡检
在库中表个数少于1W的场景,直接使用倾斜视图查询当前库内所有表的数据倾斜情况
SELECT * FROM pgxc_get_table_skewness ORDER BY totalsize DESC;

在库中表个数非常多(至少大于1W)的场景,因PGXC_GET_TABLE_SKEWNESS涉及全库查并计算非常全面的倾斜字段,所以可能会花费比较长的时间(小时级),请根据PGXC_GET_TABLE_SKEWNESS视图定义,直接使用table_distribution()函数自定义输出,减少输出列进行计算优化,例如

SELECT schemaname,tablename,max(dnsize) AS maxsize, min(dnsize) AS minsize 
FROM pg_catalog.pg_class c 
INNER JOIN pg_catalog.pg_namespace n ON n.oid = c.relnamespace 
INNER JOIN pg_catalog.table_distribution() s ON s.schemaname = n.nspname AND s.tablename = c.relname 
INNER JOIN pg_catalog.pgxc_class x ON c.oid = x.pcrelid AND x.pclocatortype = 'H' 
GROUP BY schemaname,tablename;

建议:

分布健选择:

  1. 字段的值尽量离散;
  2. 选择分布健唯一键;
  3. 根据业务场景选择多的字段作为分布健。
相关推荐
Gauss松鼠会8 天前
ElasticSearch迁移至openGauss
大数据·数据库·elasticsearch·jenkins·opengauss·gaussdb
Navicat中国10 天前
Mac 版不能连接华为 GaussDB 吗?我看 Windows 版可以连接?
数据库·信息可视化·navicat·gaussdb
Gauss松鼠会11 天前
GaussDB安全配置最佳实践:构建企业级数据防护体系
数据库·sql·安全·性能优化·database·gaussdb
Gauss松鼠会11 天前
GaussDB资源冻结与解冻:精细化资源管理的实践与策略
数据库·人工智能·sql·database·gaussdb
zhangxzq11 天前
华为高斯数据库(GaussDB)深度解析:国产分布式数据库的旗舰之作
数据库·分布式·gaussdb
Vic1010116 天前
GaussDB(PostgreSQL)查询执行计划参数解析技术文档
算法·哈希算法·gaussdb
DarkAthena16 天前
【GaussDB】使用DBLINK连接到ORACLE
数据库·oracle·gaussdb
Gauss松鼠会17 天前
从数据到智能:openGauss+openEuler Intelligence的RAG架构实战
数据库·架构·database·opengauss·gaussdb
Vic1010118 天前
创建索引:GaussDB(PostgreSQL)开发笔记
笔记·postgresql·gaussdb
淡定是个好东西22 天前
springboot连接高斯数据库(GaussDB)踩坑指南
数据库·gaussdb