达梦导入大数据

达梦导入大数据

Python脚本

python 复制代码
#!/usr/bin/env python3
# -*- coding: utf-8 -*-

import os
import sys

INPUT_FILE  = "HB_LOWAIR1209.sql"
OUTPUT_FILE = "HB_LOWAIR20251127_final_gb18030.sql"

HEADER_LINES = [
    "WHENEVER SQLERROR CONTINUE;",
    "SET AUTOCOMMIT OFF;"
]

def detect_encoding(filepath):
    """简单探测编码,优先用 UTF-8,失败则试 GB18030 / GBK"""
    for enc in ['utf-8', 'gb18030', 'gbk']:
        try:
            with open(filepath, 'r', encoding=enc) as f:
                f.readline()  # 只读一行测试
            return enc
        except (UnicodeDecodeError, UnicodeError):
            continue
    return 'latin1'  # 最后兜底

def main():
    if not os.path.isfile(INPUT_FILE):
        print(f"错误:输入文件 '{INPUT_FILE}' 不存在!", file=sys.stderr)
        sys.exit(1)

    # 探测原始编码
    src_encoding = detect_encoding(INPUT_FILE)
    print(f"✓ 检测到源文件编码: {src_encoding}")

    # 流式写入:先写头部,再逐行复制原文件
    try:
        with open(INPUT_FILE, 'r', encoding=src_encoding, errors='replace') as fin, \
             open(OUTPUT_FILE, 'w', encoding='gb18030', newline='') as fout:

            # 写入头部
            for line in HEADER_LINES:
                fout.write(line + "\n")
            fout.write("\n")  # 空行分隔

            # 逐行复制原文件(避免内存爆炸)
            for line in fin:
                fout.write(line)

        print(f"✓ 成功生成 GB18030 编码文件: {OUTPUT_FILE}")
        print(f"  请手动执行后续 docker cp 和 disql 命令。")

    except Exception as e:
        print(f"❌ 处理过程中出错: {e}", file=sys.stderr)
        sys.exit(1)

if __name__ == "__main__":
    main()

执行脚本

复制代码
docker cp HB_LOWAIR20251127_final_gb18030.sql dm8_container:/tmp/

docker exec -d dm8_container sh -c "
  export LANG=zh_CN.GB18030 &&
  export LC_ALL=zh_CN.GB18030 &&
  export LD_LIBRARY_PATH=/opt/dmdbms/bin:\$LD_LIBRARY_PATH &&
  cd /tmp &&
  cat HB_LOWAIR20251127_final_gb18030.sql | /opt/dmdbms/bin/disql -L SYSDBA/SYSDBA001 > import.log 2>&1
"
相关推荐
KaMeidebaby几秒前
卡梅德生物技术快报|多肽库筛选:基于全质粒 PCR 的噬菌体文库构建与小分子表位淘选实战
前端·数据库·其他·百度·新浪微博
phltxy7 分钟前
Redis 常见面试题
数据库·redis·缓存
IpdataCloud8 分钟前
IP查询工具怎么选?在线API vs IP离线库:精度、速度、成本、隐私全对比
服务器·网络·数据库
爱吃土豆的马铃薯ㅤㅤㅤㅤㅤㅤㅤㅤㅤ8 分钟前
MySQL选择字符集和排序规则
数据库·mysql
旺仔Sec14 分钟前
HBase 分布式集群部署实战:从解压到启动的完整指南
数据库·分布式·hbase
Gauss松鼠会16 分钟前
GaussDB(DWS) 资源监控Topsql
java·网络·数据库·算法·oracle·性能优化·gaussdb
小碗羊肉17 分钟前
【Redis | 第二篇】Jedis&SpringDataRedis
数据库·redis·缓存
郝学胜-神的一滴21 分钟前
系统设计 012:从用户系统出发,吃透缓存、数据库与高并发设计
java·数据库·python·缓存·php·软件构建
米高梅狮子21 分钟前
01.ELK企业日志分析系统
运维·服务器·网络·数据库·elk·oracle
小杍随笔24 分钟前
【redb vs SQLite (rusqlite) 技术选型对比】
数据库·sqlite