采用dmpython库连接达梦数据库,通过以下查询方式获取某一schema的所有表信息,然后获取数据库表的数据量、占用空间及实际大小:
1)查询表dba_tables获取指定schema的所有数据库表;
2)通过select count(1)查询每张表中的数据条数;
3)通过SELECT TABLE_USED_SPACE查询每张表的占用数据页数;
4)通过SELECT TABLE_USED_PAGES查询每张表的实际使用数据页数;
5)通过查询表V$DM_INI获取数据页数的大小。
基于上述查询方式获取指定模式的数据库表信息,并将表信息以字典和元组形式保存,最终序列化到本地json文件内,主要程序如下所示:
python
import dmPython
import json
queryresult={}
schemaname='SCHOOL'
# 创建连接
conn = dmPython.connect(
server="127.0.0.1",
port=5236,
user="XXXXXX",
password="XXXXXXXXX",
schema=schemaname
)
# 执行SQL查询
cursor = conn.cursor()
cursor.execute("select TABLE_NAME from dba_tables where owner='SCHOOL'")
tables = cursor.fetchall()
for table in tables:
tablename=str(table[0])
# 获取表中数据总数
cursor.execute("select count(1) from "+str(tablename))
rowcount =cursor.fetchone()
# 获取表占用空间 KB
cursor.execute("SELECT TABLE_USED_SPACE( '"+schemaname+"', '"+str(tablename)+"') * PARA_VALUE / 1024 FROM V$DM_INI WHERE PARA_NAME = 'GLOBAL_PAGE_SIZE'")
tabletotalsize =cursor.fetchone()
# 获取表使用空间 KB
cursor.execute("SELECT TABLE_USED_PAGES( '"+schemaname+"', '"+str(tablename)+"') * PARA_VALUE / 1024 FROM V$DM_INI WHERE PARA_NAME = 'GLOBAL_PAGE_SIZE'")
tableusedsize =cursor.fetchone()
queryresult[tablename]=(rowcount[0],int(tabletotalsize[0]),int(tableusedsize[0]))
# 关闭连接
cursor.close()
conn.close()
savename='tableinfo.json'
print(queryresult)
save_data = {
"dict_count": len(queryresult),
"data": {key: list(value) for key, value in queryresult.items()}
}
with open(savename, 'w', encoding='utf-8') as f:
json.dump(save_data, f, indent=4, ensure_ascii=False)
运行上述程序,保存第一次的数据库表信息,然后向数据库表中插入数据,再次运行程序保存第二次数据,如下图所示,可以看出前后两次的数据库表变化,后续学习并测试如何通过程序自动比较前后两次的数据库表信息变化。

参考文献:
1\]https://eco.dameng.com/community/post/20241218072309WHQAOUSCT4WRAEQYOX \[2\]https://vip.kingdee.com/knowledge/616295238575048448?productLineId=8\&isKnowledge=2\&lang=zh-CN