StarRocks导出ddl

python 复制代码
import pymysql
import pandas as pd

# --- 请在此处填写您的StarRocks连接信息 ---
host = '172.31.0.1'  # StarRocks FE 主机地址
port = 9030                   # StarRocks FE 查询端口,默认为 9030
user = 'xxx'        # StarRocks 用户名
password = 'xxx'    # StarRocks 密码
# --- 连接信息填写完毕 ---

def export_starrocks_ddl_to_excel():
    """
    连接到StarRocks集群,获取所有库和表的DDL,并将其导出到Excel文件。
    """
    connection = None
    try:
        # 1. 连接到StarRocks
        connection = pymysql.connect(
            host=host,
            port=port,
            user=user,
            password=password,
            charset='utf8mb4'
        )
        print("已成功连接到StarRocks。")

        all_tables_ddl = []
        
        with connection.cursor() as cursor:
            # 2. 获取所有数据库
            cursor.execute("SHOW DATABASES")
            databases = [row[0] for row in cursor.fetchall()]

            # 排除系统数据库
            excluded_dbs = {'information_schema', '_statistics_','sr_dump_test','sys'}
            databases_to_scan = [db for db in databases if db not in excluded_dbs]
            print(f"将要扫描的数据库: {databases_to_scan}")

            file = open('show_create_table.sql', 'w',encoding='utf-8') 

            # 3. 遍历数据库和表,获取DDL
            for db_name in databases_to_scan:
                cursor.execute(f"USE `{db_name}`")
                cursor.execute("SHOW TABLES")
                tables = [row[0] for row in cursor.fetchall()]
                
                file.write(f"use {db_name};\n")
                
                for table_name in tables:
                    try:
                        cursor.execute(f"SHOW CREATE TABLE `{db_name}`.`{table_name}`")
                        ddl_result = cursor.fetchone()
                        # 'SHOW CREATE TABLE' 的结果是 (Table, Create Table)
                        if ddl_result and len(ddl_result) > 1:
                            ddl_statement = ddl_result[1]
                            all_tables_ddl.append({
                                '库名': db_name,
                                '表名': table_name,
                                'ddl': ddl_statement
                            })
                            print(f"成功获取 `{db_name}`.`{table_name}` 的DDL。")
                            file.write(ddl_statement+'\n')
                    except Exception as e:
                        print(f"获取 `{db_name}`.`{table_name}` DDL失败: {e}")
            file.close()
        # 4. 将数据转换为DataFrame并导出到Excel
        if all_tables_ddl:
            df = pd.DataFrame(all_tables_ddl)
            output_filename = 'show_create_table.csv'
            df.to_csv(output_filename,  index=False, encoding='utf-8')
            print(f"\n所有DDL已成功导出到 '{output_filename}'。")
        else:
            print("未找到任何用户表,无法生成Excel文件。")

    except pymysql.MySQLError as e:
        print(f"数据库连接或操作失败: {e}")
    except Exception as e:
        print(f"发生未知错误: {e}")
    finally:
        if connection:
            connection.close()
            print("数据库连接已关闭。")

if __name__ == '__main__':
    export_starrocks_ddl_to_excel()
相关推荐
2501_914245932 小时前
CSS如何实现元素旋转动画_利用transform旋转与动画组合
jvm·数据库·python
Gauss松鼠会2 小时前
【GaussDB】浅谈SQL与ETL
数据库·数据仓库·sql·etl·gaussdb·经验总结
Shorasul2 小时前
CSS如何解决Less与CSS兼容性问题_通过配置文件实现平滑过渡与混合开发
jvm·数据库·python
qq_413847402 小时前
HTML支持变量吗_与JavaScript数据绑定方式【解答】
jvm·数据库·python
qq_342295822 小时前
换CPU对HTML开发帮助大吗_多核与单核性能对比说明【说明】
jvm·数据库·python
倔强的石头_2 小时前
kingbase备份与恢复实战(四)—— Windows物理备份:停库冷备拷贝数据目录与恢复拉起
数据库
gmaajt2 小时前
SQL如何用SQL子查询查找最大值对应行_关联主键优化方案
jvm·数据库·python
21439652 小时前
mysql如何配置插件以提升查询性能_安装启用memcached插件
jvm·数据库·python
2401_887724502 小时前
如何重建AWR存储库_清理损坏的AWR数据并重新初始化字典表
jvm·数据库·python