前言
做过数据库迁移的同学都知道,最头疼的不是"能不能迁过去",而是"迁完上线那天心里发不发虚"。跑了十几年的老系统,SQL到处飞、存储过程好几千行、触发器一层套一层------但凡有个函数行为差了那么一丁点,上线就是个事故。这篇文章不搞虚的,就聊实操:哪些语法有差异、函数怎么映射、哪些坑已经有人替你踩过了。
文章目录
- 前言
-
- 一、先说结论:能直接搬的和不能直接搬的
-
- [1.1 放心搬的部分](#1.1 放心搬的部分)
- [1.2 重点盯着的部分](#1.2 重点盯着的部分)
- 二、数据类型:28种全兼容,但别把坏习惯也搬过来
-
- [2.1 建表语句直接搬](#2.1 建表语句直接搬)
- [2.2 JSON和XML也没问题](#2.2 JSON和XML也没问题)
- [2.3 迁移时顺手修掉的坏习惯](#2.3 迁移时顺手修掉的坏习惯)
- 三、函数迁移:200+函数哪些直接用,哪些有坑
-
- [3.1 放心用的函数(零差异)](#3.1 放心用的函数(零差异))
- [3.2 有坑的函数(务必逐一测试)](#3.2 有坑的函数(务必逐一测试))
- [3.3 函数映射速查表](#3.3 函数映射速查表)
- 四、PL/SQL迁移:存储过程、包、触发器怎么搬
-
- [4.1 存储过程:大多数直接搬](#4.1 存储过程:大多数直接搬)
- [4.2 包(Package):函数重载和初始化块](#4.2 包(Package):函数重载和初始化块)
- [4.3 触发器:三种时机都支持](#4.3 触发器:三种时机都支持)
- [4.4 动态SQL和批量操作](#4.4 动态SQL和批量操作)
- 五、SQL语法迁移:分页、MERGE、层次查询怎么写
-
- [5.1 分页查询](#5.1 分页查询)
- [5.2 MERGE和INSERT ALL](#5.2 MERGE和INSERT ALL)
- [5.3 层次查询:组织架构树](#5.3 层次查询:组织架构树)
- 六、趁迁移优化一波:别把坏代码也搬过去
-
- [6.1 查询优化:最容易改、效果最明显](#6.1 查询优化:最容易改、效果最明显)
- [6.2 索引检查:外键没索引是大坑](#6.2 索引检查:外键没索引是大坑)
- [6.3 大表分区策略](#6.3 大表分区策略)
- [6.4 连接池参数调整](#6.4 连接池参数调整)
- 七、数据迁移实操:导出来、导进去、验证一遍
-
- [7.1 小数据量:用exp/imp直接搬](#7.1 小数据量:用exp/imp直接搬)
- [7.2 大数据量:用sys_bulkload高速加载](#7.2 大数据量:用sys_bulkload高速加载)
- [7.3 导入后的验证脚本](#7.3 导入后的验证脚本)
- 八、应用端适配:JDBC、ODBC、OCI怎么改
-
- [8.1 JDBC连接改两行就够](#8.1 JDBC连接改两行就够)
- [8.2 ODBC连接](#8.2 ODBC连接)
- [8.3 OCI / Pro*C / OCCI](#8.3 OCI / Pro*C / OCCI)
- 九、避坑清单:上线前逐条过一遍
- 十、最后说两句
一、先说结论:能直接搬的和不能直接搬的
一句话总结:Oracle的SQL和PL/SQL代码,大部分搬到KingbaseES上直接就能跑,不需要改。但"大部分"不是"全部"------你提前知道哪几个点有差异,比上线以后熬夜排查强一百倍。
1.1 放心搬的部分
以下这些东西从Oracle搬到KingbaseES,一行不用改:
- 28种数据类型(NUMBER、VARCHAR2、DATE、TIMESTAMP、CLOB、BLOB一个不少)
- 基本SQL语法(SELECT、INSERT、UPDATE、DELETE、MERGE)
dual虚拟表(Oracle老项目里到处都是FROM dual,放心用)- ROWNUM、ROWID伪列
- 序列(CREATE SEQUENCE、NEXTVAL、CURRVAL)
- 层次查询(CONNECT BY,画组织架构树用的那个)
- PL/SQL控制语句(IF、CASE、LOOP、FOR、WHILE)
- 存储过程、函数、包、触发器
- 21个内置包(DBMS_OUTPUT、DBMS_SQL、UTL_HTTP等)
- 70+系统视图(ALL_TABLES、DBA_USERS、V$SESSION等)
- MERGE语句、INSERT ALL、FLASHBACK查询、DBLink
看着挺多是吧?没错,覆盖面确实广。但别高兴太早------下面这些有差异的地方,才是你迁移时要花心思的。
1.2 重点盯着的部分
| 类别 | 差异点 | 严重程度 | 一句话说明 |
|---|---|---|---|
| CHR函数 | 不允许CHR(0) | 中 | Oracle能传0,这边直接报错 |
| CONVERT函数 | 参数顺序相反 | 高 | SQL不报错但返回乱码,最阴 |
| 正则表达式 | match_param部分含义不同 | 中 | 涉及正则的SQL要用真实数据验证 |
| CURRENT_TIMESTAMP | 精度可能不同 | 低 | 显式指定精度就行 |
| NULLIF | 允许参数为NULL | 低 | 行为有利,不用管 |
| 对象命名 | 保留字列表有差异 | 中 | 建表时字段名可能撞关键字 |
| 隐式类型转换 | 规则存在差异 | 中 | 关联字段类型不一致会踩坑 |
接下来一个一个掰开讲。
二、数据类型:28种全兼容,但别把坏习惯也搬过来
2.1 建表语句直接搬
数据类型这块是最省心的。Oracle用什么类型,KingbaseES就用什么类型,不需要做任何映射转换。看个实际例子------下面这张表用了十几种不同的Oracle类型,搬过来一字不改:
sql
-- 这条建表语句,Oracle和KingbaseES跑出来一模一样
CREATE TABLE orders (
order_id NUMBER(12) PRIMARY KEY,
order_no VARCHAR2(50) NOT NULL,
status CHAR(1),
amount NUMBER(12,2),
discount FLOAT,
order_date DATE,
created_at TIMESTAMP,
delivery_ts TIMESTAMP WITH TIME ZONE,
local_ts TIMESTAMP WITH LOCAL TIME ZONE,
warranty INTERVAL YEAR TO MONTH,
delivery_span INTERVAL DAY TO SECOND,
description CLOB,
attachment BLOB,
raw_data RAW(500),
ext_file BFILE,
row_loc ROWID,
extra_info NVARCHAR2(500),
tags NCHAR(100)
);
包括BFILE、UROWID、LONG RAW这些平时不太用的冷门类型,也全部支持。
2.2 JSON和XML也没问题
现在新项目基本都绕不开JSON了。KingbaseES支持JSON和JSONB两种类型,前者存原始文本,后者存二进制解析后的格式,查询更快:
sql
-- 建表、插入、查询,写法跟Oracle一致
CREATE TABLE product_catalog (
id NUMBER PRIMARY KEY,
attributes JSON,
metadata JSONB
);
INSERT INTO product_catalog VALUES (
1,
'{"name": "笔记本电脑", "price": 5999, "tags": ["电子", "办公"]}',
'{"source": "官方"}'
);
-- 提取JSON字段
SELECT JSON_VALUE(attributes, '$.name') AS product_name FROM product_catalog;
-- JSON_TABLE:把JSON展开成表来查,做报表很好用
SELECT jt.name, jt.price
FROM product_catalog,
JSON_TABLE(attributes, '$'
COLUMNS (name VARCHAR2(100) PATH '$.name',
price NUMBER PATH '$.price')
) jt;
2.3 迁移时顺手修掉的坏习惯
迁移不是简单的"搬家",也是个给老代码"体检"的好机会。列设计上常见的几个问题,趁迁移一并修了:
sql
-- 坏设计:日期用字符串、金额也用字符串、状态用数字
CREATE TABLE bad_order (
order_date VARCHAR2(20), -- 该用DATE
amount VARCHAR2(20), -- 该用NUMBER
status NUMBER -- 只有几个值,用CHAR(1)更清楚
);
-- 好设计
CREATE TABLE good_order (
order_date DATE, -- 日期就用日期类型
amount NUMBER(12,2), -- 金额就用数值类型
status CHAR(1) -- 'Y'/'N' 比 1/0 直观
);
还有个容易忽视的点:多表关联的时候,关联字段的数据类型必须一致。Oracle项目里经常出现一个表用INTEGER、另一个表用VARCHAR来存同一个ID的情况。在Oracle里可能靠隐式转换蒙混过关了,但迁移之后隐式转换规则可能不同,关联就出问题了。迁移时务必检查一遍关联字段的类型是否统一。
三、函数迁移:200+函数哪些直接用,哪些有坑
函数是迁移中最容易翻车的地方。Oracle里跑得好好的函数,换个库结果不一样------这种bug上线以后查起来特别头疼,因为SQL不报错,只是数据悄悄变了。
3.1 放心用的函数(零差异)
下面这些函数在KingbaseES中的行为和Oracle完全一致,搬过来直接用就行:
sql
-- 数字函数:26个全部兼容,行为一模一样
SELECT
ABS(-15) AS abs_val, -- 15
CEIL(4.3) AS ceil_val, -- 5
FLOOR(4.7) AS floor_val, -- 4
ROUND(3.1415, 2) AS round_val, -- 3.14
TRUNC(3.1415, 2) AS trunc_val, -- 3.14
MOD(10, 3) AS mod_val, -- 1
POWER(2, 10) AS power_val, -- 1024
SQRT(144) AS sqrt_val, -- 12
SIGN(-5) AS sign_val -- -1
FROM dual;
-- 字符函数:19个全部兼容
SELECT
UPPER('hello') AS upper_str, -- HELLO
LOWER('WORLD') AS lower_str, -- world
INITCAP('hello you') AS initcap_str, -- Hello You
SUBSTR('abcdef',2,3) AS sub_str, -- bcd
INSTR('abcdef','cd') AS pos, -- 3
LPAD('123', 8, '0') AS padded, -- 00000123
TRIM(' hi ') AS trimmed, -- hi
REPLACE('hello','l','L') AS replaced -- heLLo
FROM dual;
-- 日期函数:22个全部兼容
SELECT
SYSDATE AS now,
ADD_MONTHS(DATE '2025-01-15', 3) AS after_3m,
LAST_DAY(DATE '2025-02-10') AS feb_last,
NEXT_DAY(DATE '2025-03-15', 'MONDAY') AS next_mon,
TRUNC(SYSDATE, 'MONTH') AS month_start,
TO_CHAR(SYSDATE, 'YYYY-MM-DD HH24:MI:SS') AS formatted
FROM dual;
-- 聚集函数:30个全部兼容,包括LISTAGG
SELECT
department_id,
COUNT(*) AS emp_count,
AVG(salary) AS avg_sal,
SUM(salary) AS total_sal,
LISTAGG(emp_name, ',') WITHIN GROUP (ORDER BY emp_id) AS name_list
FROM employees
GROUP BY department_id;
-- 分析函数:31个全部兼容,窗口查询直接搬
SELECT
emp_name,
salary,
ROW_NUMBER() OVER (ORDER BY salary DESC) AS rn,
RANK() OVER (ORDER BY salary DESC) AS rnk,
DENSE_RANK() OVER (ORDER BY salary DESC) AS d_rnk,
LAG(salary, 1) OVER (ORDER BY salary) AS prev_sal,
LEAD(salary, 1) OVER (ORDER BY salary) AS next_sal
FROM employees;
3.2 有坑的函数(务必逐一测试)
坑位一:CHR函数------传0直接报错
Oracle允许CHR(0),返回一个空字符(NUL)。KingbaseES不接受这个参数,直接抛异常。如果你代码里用CHR(0)做字段分隔符或占位符,必须改掉:
sql
-- Oracle写法:不报错,返回包含空字符的字符串
SELECT 'A' || CHR(0) || 'B' FROM dual;
-- 迁移后报错!改写方案:用Tab(CHR(9))或换行(CHR(10))替代
SELECT 'A' || CHR(9) || 'B' FROM dual;
-- 如果是做字符串分隔,也可以用不可见的Unit Separator
SELECT 'A' || CHR(31) || 'B' FROM dual;
坑位二:CONVERT函数------参数顺序是反的
这个坑最阴。SQL不会报错,返回的结果是一串乱码,而且你乍一看可能还察觉不到。原因很简单:第二、三个参数的位置跟Oracle反过来了。
sql
-- Oracle写法:CONVERT(字符串, 目标字符集, 源字符集)
SELECT CONVERT('测试文字', 'ZHS16GBK', 'AL32UTF8') FROM dual;
-- KingbaseES写法:第二三个参数顺序要反过来!
SELECT CONVERT('测试文字', 'AL32UTF8', 'ZHS16GBK') FROM dual;
处理建议 :迁移前全文搜索CONVERT关键字,把每一条SQL都揪出来确认参数顺序。
坑位三:正则表达式------match_param行为有差异
Oracle的正则函数(REGEXP_REPLACE、REGEXP_COUNT、REGEXP_INSTR)支持一个match_param参数,用来控制大小写敏感、多行模式等。KingbaseES也支持这个参数,但部分标志位的行为不完全一致:
sql
-- 这类SQL一定要用真实数据跑一遍,对比两边结果
SELECT REGEXP_COUNT('Hello World', 'hello', 1, 'i') FROM dual;
-- 涉及time类型的正则场景,差异更容易暴露
SELECT REGEXP_INSTR(time_col::text, '\d{2}:\d{2}') FROM schedule_table;
处理建议 :全局搜索REGEXP_关键字,把涉及正则的SQL全部标记出来,用真实业务数据做结果对比。
坑位四:CURRENT_TIMESTAMP------精度可能不同
sql
-- 不指定精度的话,两边返回的小数位数可能不一样
SELECT CURRENT_TIMESTAMP FROM dual;
-- 保险做法:显式指定精度
SELECT CURRENT_TIMESTAMP(6) FROM dual;
3.3 函数映射速查表
迁移的时候手边放一张表,遇到拿不准的随时查:
| Oracle函数 | KingbaseES | 状态 | 备注 |
|---|---|---|---|
| ABS、CEIL、FLOOR、ROUND、TRUNC | 同名 | 绿灯 | 直接用 |
| UPPER、LOWER、SUBSTR、INSTR、TRIM | 同名 | 绿灯 | 直接用 |
| REPLACE、CONCAT、LPAD、RPAD、INITCAP | 同名 | 绿灯 | 直接用 |
| SYSDATE、CURRENT_DATE | 同名 | 绿灯 | 直接用 |
| ADD_MONTHS、LAST_DAY、NEXT_DAY | 同名 | 绿灯 | 直接用 |
| TO_CHAR、TO_DATE、TO_NUMBER | 同名 | 绿灯 | 直接用 |
| NVL、NVL2、COALESCE、DECODE | 同名 | 绿灯 | 直接用 |
| LISTAGG | 同名 | 绿灯 | 直接用 |
| ROW_NUMBER、RANK、DENSE_RANK | 同名 | 绿灯 | 直接用 |
| LAG、LEAD、FIRST_VALUE、LAST_VALUE | 同名 | 绿灯 | 直接用 |
| JSON_VALUE、JSON_QUERY、JSON_OBJECT | 同名 | 绿灯 | 直接用 |
| XMLELEMENT、XMLFOREST、XMLAGG | 同名 | 绿灯 | 直接用 |
| CHR | 同名 | 黄灯 | 不能传0 |
| CONVERT | 同名 | 红灯 | 参数顺序反的 |
| REGEXP_REPLACE、REGEXP_COUNT | 同名 | 黄灯 | match_param有差异 |
| CURRENT_TIMESTAMP | 同名 | 黄灯 | 建议显式指定精度 |
| NULLIF | 同名 | 绿灯 | 允许NULL参数,行为有利 |
四、PL/SQL迁移:存储过程、包、触发器怎么搬
PL/SQL是迁移里头最复杂的部分,也是业务逻辑最集中的地方。好消息是KingbaseES对PL/SQL做到了全面兼容,坏消息是你仍然需要逐个编译验证。
4.1 存储过程:大多数直接搬
sql
-- 这个Oracle存储过程,搬到KingbaseES上一行不改就能编译运行
CREATE OR REPLACE PROCEDURE calc_monthly_report(
p_year IN NUMBER,
p_month IN NUMBER,
p_status OUT VARCHAR2
) AS
v_count NUMBER;
BEGIN
EXECUTE IMMEDIATE 'TRUNCATE TABLE tmp_report';
INSERT INTO tmp_report
SELECT department_id, SUM(amount), COUNT(*)
FROM transactions
WHERE EXTRACT(YEAR FROM trans_date) = p_year
AND EXTRACT(MONTH FROM trans_date) = p_month
GROUP BY department_id;
SELECT COUNT(*) INTO v_count FROM tmp_report;
IF v_count = 0 THEN
p_status := 'NO_DATA';
ELSE
p_status := 'SUCCESS';
END IF;
EXCEPTION
WHEN OTHERS THEN
p_status := 'ERROR: ' || SQLERRM;
ROLLBACK;
END calc_monthly_report;
/
导入之后,跑一条语句检查编译状态:
sql
-- 查看哪些对象编译失败了
SELECT object_name, object_type, status
FROM user_objects
WHERE status = 'INVALID'
ORDER BY object_type;
4.2 包(Package):函数重载和初始化块
包是Oracle最有特色的功能之一。KingbaseES不仅支持自定义包,还支持函数重载(同名不同参数)和包初始化块:
sql
-- 包规范:定义对外接口
CREATE OR REPLACE PACKAGE pkg_order AS
MAX_ITEMS CONSTANT NUMBER := 100;
-- 两个同名函数,参数不同(重载)
FUNCTION get_total(p_order_id NUMBER) RETURN NUMBER;
FUNCTION get_total(p_order_id NUMBER, p_include_tax NUMBER) RETURN NUMBER;
PROCEDURE cancel_order(p_order_id NUMBER);
END pkg_order;
/
-- 包体:实现具体逻辑
CREATE OR REPLACE PACKAGE BODY pkg_order AS
g_cancel_count NUMBER := 0;
-- 不含税版本
FUNCTION get_total(p_order_id NUMBER) RETURN NUMBER AS
v_total NUMBER;
BEGIN
SELECT SUM(quantity * unit_price) INTO v_total
FROM order_items WHERE order_id = p_order_id;
RETURN NVL(v_total, 0);
END get_total;
-- 含税版本(重载)
FUNCTION get_total(p_order_id NUMBER, p_include_tax NUMBER)
RETURN NUMBER AS
BEGIN
IF p_include_tax = 1 THEN
RETURN get_total(p_order_id) * 1.13;
ELSE
RETURN get_total(p_order_id);
END IF;
END get_total;
PROCEDURE cancel_order(p_order_id NUMBER) AS
BEGIN
UPDATE orders SET status = 'CANCELLED'
WHERE order_id = p_order_id;
g_cancel_count := g_cancel_count + 1;
COMMIT;
END cancel_order;
BEGIN
-- 包初始化块:首次被调用时自动执行
SELECT COUNT(*) INTO g_cancel_count
FROM orders WHERE status = 'CANCELLED';
END pkg_order;
/
4.3 触发器:三种时机都支持
行级触发器、语句级触发器、INSTEAD OF触发器------全都兼容。迁移后注意检查触发器之间有没有循环调用的链路:
sql
-- 行级BEFORE触发器:审计薪资变更
CREATE OR REPLACE TRIGGER trg_salary_audit
BEFORE UPDATE OF salary ON employees
FOR EACH ROW
BEGIN
IF :NEW.salary != :OLD.salary THEN
INSERT INTO salary_audit_log(
emp_id, old_salary, new_salary, changed_by, changed_at
) VALUES(
:NEW.emp_id, :OLD.salary, :NEW.salary, USER, SYSDATE
);
END IF;
END;
/
-- INSTEAD OF触发器:让多表联查的视图也能UPDATE
CREATE OR REPLACE VIEW emp_detail AS
SELECT e.emp_id, e.emp_name, e.salary, d.dept_name
FROM employees e, departments d
WHERE e.dept_id = d.dept_id;
CREATE OR REPLACE TRIGGER trg_emp_detail_update
INSTEAD OF UPDATE ON emp_detail
FOR EACH ROW
BEGIN
UPDATE employees SET
emp_name = :NEW.emp_name,
salary = :NEW.salary
WHERE emp_id = :NEW.emp_id;
END;
/
-- 启用/禁用触发器
ALTER TRIGGER trg_salary_audit DISABLE;
ALTER TRIGGER trg_salary_audit ENABLE;
4.4 动态SQL和批量操作
动态SQL有两种写法,取决于你需不需要在编译时确定列的类型:
sql
-- 写法一:EXECUTE IMMEDIATE------大多数场景够用
CREATE OR REPLACE PROCEDURE dynamic_count(
p_table_name VARCHAR2
) AS
v_count NUMBER;
BEGIN
EXECUTE IMMEDIATE 'SELECT COUNT(*) FROM ' || p_table_name
INTO v_count;
DBMS_OUTPUT.PUT_LINE(p_table_name || ' 共 ' || v_count || ' 行');
END;
/
-- 写法二:DBMS_SQL------列的类型和数量在编译时不确定时用
DECLARE
v_cursor INTEGER;
v_name VARCHAR2(100);
v_sal NUMBER;
BEGIN
v_cursor := DBMS_SQL.OPEN_CURSOR;
DBMS_SQL.PARSE(v_cursor,
'SELECT emp_name, salary FROM employees WHERE salary > :1',
DBMS_SQL.NATIVE);
DBMS_SQL.BIND_VARIABLE(v_cursor, ':1', 10000);
DBMS_SQL.DEFINE_COLUMN(v_cursor, 1, v_name, 100);
DBMS_SQL.DEFINE_COLUMN(v_cursor, 2, v_sal);
DBMS_SQL.EXECUTE(v_cursor);
LOOP
EXIT WHEN DBMS_SQL.FETCH_ROWS(v_cursor) = 0;
DBMS_SQL.COLUMN_VALUE(v_cursor, 1, v_name);
DBMS_SQL.COLUMN_VALUE(v_cursor, 2, v_sal);
DBMS_OUTPUT.PUT_LINE(v_name || ': ' || v_sal);
END LOOP;
DBMS_SQL.CLOSE_CURSOR(v_cursor);
END;
/
批量操作用FORALL和BULK COLLECT,性能比循环单条执行快很多:
sql
-- FORALL:批量删除,一条语句干掉整个集合
DECLARE
TYPE id_list IS TABLE OF NUMBER;
v_ids id_list := id_list(101, 102, 103, 104, 105);
BEGIN
FORALL i IN v_ids.FIRST .. v_ids.LAST
DELETE FROM temp_data WHERE id = v_ids(i);
DBMS_OUTPUT.PUT_LINE('删除了 ' || SQL%ROWCOUNT || ' 行');
END;
/
-- BULK COLLECT:批量查询到集合里,省去来回切换上下文
DECLARE
TYPE emp_array IS TABLE OF employees%ROWTYPE;
v_emps emp_array;
BEGIN
SELECT * BULK COLLECT INTO v_emps
FROM employees WHERE department_id = 10;
FOR i IN v_emps.FIRST .. v_emps.LAST LOOP
DBMS_OUTPUT.PUT_LINE(v_emps(i).emp_name || ': ' || v_emps(i).salary);
END LOOP;
END;
/
五、SQL语法迁移:分页、MERGE、层次查询怎么写
5.1 分页查询
Oracle的分页写法有好几种,KingbaseES全部兼容:
sql
-- 写法一:传统ROWNUM分页(Oracle 8i就有了,老项目里最多)
SELECT * FROM (
SELECT a.*, ROWNUM rn FROM (
SELECT emp_name, salary FROM employees ORDER BY salary DESC
) a WHERE ROWNUM <= 20
) WHERE rn > 10;
-- 写法二:12c+的OFFSET...FETCH(新项目常用)
SELECT emp_name, salary FROM employees
ORDER BY salary DESC
OFFSET 10 ROWS FETCH NEXT 10 ROWS ONLY;
5.2 MERGE和INSERT ALL
sql
-- MERGE:数据同步神器------有就更新,没有就插入
MERGE INTO target t
USING source s
ON (t.id = s.id)
WHEN MATCHED THEN
UPDATE SET t.name = s.name, t.val = s.val
WHEN NOT MATCHED THEN
INSERT (id, name, val) VALUES (s.id, s.name, s.val);
-- INSERT ALL:一条SELECT插入多张表
INSERT ALL
INTO emp_active (emp_id, name, salary) VALUES (emp_id, name, salary)
INTO emp_audit (emp_id, action, time) VALUES (emp_id, 'MIGRATE', SYSDATE)
SELECT emp_id, name, salary FROM employees WHERE status = 'ACTIVE';
-- INSERT RETURNING:插入后返回自增ID
INSERT INTO employees(emp_name, salary)
VALUES ('新员工', 10000)
RETURNING emp_id INTO :new_id;
5.3 层次查询:组织架构树
sql
-- 画组织架构树,完全兼容Oracle写法
SELECT
LEVEL,
LPAD(' ', 2 * (LEVEL - 1)) || emp_name AS org_chart,
CONNECT_BY_ISLEAF AS is_leaf,
SYS_CONNECT_BY_PATH(emp_name, ' / ') AS full_path
FROM employees
START WITH manager_id IS NULL
CONNECT BY PRIOR emp_id = manager_id
ORDER SIBLINGS BY emp_name;
六、趁迁移优化一波:别把坏代码也搬过去
迁移是个"搬家"的过程,但也是个"大扫除"的好机会。下面这些优化建议,建议在迁移时顺手做了。
6.1 查询优化:最容易改、效果最明显
sql
-- 不要 SELECT *(字段多了浪费带宽,还会阻止覆盖索引生效)
SELECT emp_id, emp_name, salary FROM employees WHERE dept_id = 10;
-- IN 子查询改成 EXISTS(数据量大的时候差距很明显)
SELECT * FROM orders o WHERE EXISTS (
SELECT 1 FROM vip_customers v WHERE v.customer_id = o.customer_id
);
-- UNION 改 UNION ALL(不需要去重的话,能省掉排序这一步)
SELECT name FROM table_a
UNION ALL
SELECT name FROM table_b;
-- 索引列上别套函数(套了就用不上索引了)
-- 错误:WHERE TRUNC(create_time) = DATE '2025-01-01'
-- 正确:
WHERE create_time >= DATE '2025-01-01'
AND create_time < DATE '2025-01-02';
6.2 索引检查:外键没索引是大坑
迁移完跑一段检查脚本,看看哪些外键缺索引:
sql
-- 查出所有没有索引的外键字段
SELECT
c.table_name AS "表名",
c.constraint_name AS "外键名",
cc.column_name AS "外键列",
'缺索引!建议补上' AS "建议"
FROM user_constraints c
JOIN user_cons_columns cc
ON c.constraint_name = cc.constraint_name
LEFT JOIN user_ind_columns ic
ON cc.table_name = ic.table_name
AND cc.column_name = ic.column_name
WHERE c.constraint_type = 'R'
AND ic.index_name IS NULL
ORDER BY c.table_name;
如果查出有缺索引的外键,补上:
sql
CREATE INDEX idx_order_customer ON orders(customer_id);
为什么这个重要?因为外键没索引的话,删主表数据的时候会锁住子表全部行,并发一上来就卡死。
6.3 大表分区策略
如果迁移完发现某张表超过5000万行了,就该考虑分区了:
sql
-- 按季度做Range分区(最常见的方案)
CREATE TABLE order_logs (
id NUMBER,
order_no VARCHAR2(50),
amount NUMBER(12,2),
created_at DATE
) PARTITION BY RANGE (created_at) (
PARTITION p_2025_q1 VALUES LESS THAN (DATE '2025-04-01'),
PARTITION p_2025_q2 VALUES LESS THAN (DATE '2025-07-01'),
PARTITION p_2025_q3 VALUES LESS THAN (DATE '2025-10-01'),
PARTITION p_2025_q4 VALUES LESS THAN (DATE '2026-01-01'),
PARTITION p_max VALUES LESS THAN (MAXVALUE) -- 兜底,必须有
);
几个硬指标记一下:
- 单个分区不超过5000万条,或不超过100GB
- 全库分区总数不超过10万
- Range分区一定要加
MAXVALUE兜底,List分区一定要加DEFAULT兜底
6.4 连接池参数调整
迁移完应用端改了连接串,连接池参数也得跟着调。别小看这个------连接池配错了,轻则响应慢,重则整个系统卡死。
java
// Java连接池配置示例(HikariCP)
HikariConfig config = new HikariConfig();
config.setJdbcUrl("jdbc:kingbase8://10.0.0.1:54321/mydb");
config.setDriverClassName("com.kingbase8.Driver");
config.setUsername("hr");
config.setPassword("password");
// 关键参数
config.setMaximumPoolSize(36); // 每个CPU核心×10,别超过
config.setMinimumIdle(10); // 最小空闲连接
config.setIdleTimeout(300000); // 空闲超时5分钟
config.setConnectionTimeout(5000); // 获取连接超时5秒
config.setMaxLifetime(1800000); // 连接最大存活30分钟
几个经验值:
- 连接数 = CPU核心数 × 10(比如2个18核的CPU,连接数36~360)
- 用静态连接池,别用动态的------动态连接池在高并发下容易触发"连接风暴",一分钟内连接数从100暴涨到几千
- 别用每次请求都新建连接的方式------频繁建连/断连是性能杀手
七、数据迁移实操:导出来、导进去、验证一遍
7.1 小数据量:用exp/imp直接搬
bash
# Oracle端导出
exp userid=hr/password@orcl OWNER=hr FILE=hr_backup.dmp LOG=hr_export.log
# KingbaseES端导入
imp userid=hr/password@kingbase FILE=hr_backup.dmp LOG=hr_import.log FROMUSER=hr TOUSER=hr
7.2 大数据量:用sys_bulkload高速加载
数据量到百万级以上,exp/imp就不够快了。sys_bulkload专门干这个,速度比普通INSERT快几十倍:
bash
sys_bulkload -i /data/import/employees.csv \
-t employees \
-d kingbase \
-U hr \
-o "type=csv" \
-o "delimiter=," \
-o "header=y"
7.3 导入后的验证脚本
导入完了别急着上线,先跑五条验证SQL:
sql
-- 验证一:表数量对不对
SELECT COUNT(*) AS table_count FROM user_tables;
-- 验证二:有没有编译失败的对象(重点!)
SELECT object_name, object_type, status
FROM user_objects
WHERE status = 'INVALID'
AND object_type IN ('PROCEDURE', 'FUNCTION', 'PACKAGE', 'PACKAGE BODY', 'TRIGGER', 'VIEW')
ORDER BY object_type, object_name;
-- 验证三:索引状态
SELECT index_name, table_name, status
FROM user_indexes
WHERE status != 'VALID'
ORDER BY table_name;
-- 验证四:约束状态
SELECT constraint_name, table_name, constraint_type, status
FROM user_constraints
WHERE status != 'ENABLED'
ORDER BY table_name;
-- 验证五:每张表的数据量(抽样跟Oracle比一下)
SELECT table_name,
(SELECT COUNT(*) FROM employees) AS spot_check -- 换成你的表名
FROM user_tables
WHERE table_name = 'EMPLOYEES';
如果第二步查出了INVALID的对象,手动重编译:
sql
-- 重编译单个对象
ALTER PACKAGE pkg_order COMPILE;
ALTER PACKAGE pkg_order COMPILE BODY;
ALTER PROCEDURE calc_monthly_report COMPILE;
ALTER TRIGGER trg_salary_audit COMPILE;
ALTER VIEW emp_detail COMPILE;
-- 或者批量重编译(生成重编译语句)
SELECT 'ALTER ' ||
CASE object_type
WHEN 'PACKAGE BODY' THEN 'PACKAGE'
WHEN 'TYPE BODY' THEN 'TYPE'
ELSE object_type
END || ' ' || object_name || ' COMPILE' ||
CASE object_type
WHEN 'PACKAGE BODY' THEN ' BODY'
WHEN 'TYPE BODY' THEN ' BODY'
ELSE ''
END || ';'
FROM user_objects
WHERE status = 'INVALID'
AND object_type IN ('PROCEDURE', 'FUNCTION', 'PACKAGE', 'PACKAGE BODY', 'TRIGGER', 'VIEW')
ORDER BY object_type;
八、应用端适配:JDBC、ODBC、OCI怎么改
8.1 JDBC连接改两行就够
java
// 改之前(Oracle)
String url = "jdbc:oracle:thin:@10.0.0.1:1521:orcl";
String driver = "oracle.jdbc.OracleDriver";
// 改之后(KingbaseES)
String url = "jdbc:kingbase8://10.0.0.1:54321/mydb";
String driver = "com.kingbase8.Driver";
// 连接池完整示例(Spring Boot配置)
// application.yml
spring:
datasource:
url: jdbc:kingbase8://10.0.0.1:54321/mydb
username: hr
password: password
driver-class-name: com.kingbase8.Driver
hikari:
maximum-pool-size: 36
minimum-idle: 10
8.2 ODBC连接
# Oracle
Driver={Oracle in OraDb11g_home1};Server=10.0.0.1;Port=1521;DBQ=orcl;
# KingbaseES
Driver={KingbaseES 8 ODBC Driver};Server=10.0.0.1;Port=54321;Database=mydb;
8.3 OCI / Pro*C / OCCI
如果应用用了Oracle原生的OCI、OCCI或者Pro*C接口,KingbaseES提供了对应的兼容接口。大部分情况改一下头文件引用和连接串就行,代码逻辑不用动。
九、避坑清单:上线前逐条过一遍
把这篇文章里提到的坑点整理成一份清单,迁移项目启动的时候打印出来,一条一条打勾:
数据类型(4条)
- 搜索代码中所有
CHR(0),改用CHR(9)或CHR(31)替代 - 搜索代码中所有
CONVERT函数,逐条确认参数顺序 - 检查多表关联字段的数据类型是否一致
- 检查JSON/XML字段的处理逻辑
函数(3条)
- 搜索代码中所有
REGEXP_开头的函数,用真实数据对比结果 - 检查
CURRENT_TIMESTAMP是否显式指定了精度 - NVL和DECODE不用改,但跑一遍确认业务逻辑没问题
PL/SQL(4条)
- 导入后检查所有对象的编译状态,有INVALID的重编译
- 检查触发器之间是否有循环调用链
- 验证DBMS_SQL、UTL_HTTP等内置包是否正常工作
- 检查动态SQL有没有SQL注入风险,趁迁移顺手修了
SQL(3条)
- 检查MERGE语句的ON条件字段是否有索引
- 层次查询用真实数据验证层级正确性
- 测试DBLink是否连通
运维(3条)
- 确认运维脚本里的系统视图都能用(V S E S S I O N 、 V SESSION、V SESSION、VLOCK等)
- 连接池配置用静态的,别用动态的
- 迁移完第一件事:配好备份再干别的
十、最后说两句
迁移这事,说难不难,说简单也确实不简单。核心就三步:
评估------把Oracle里用了哪些特性摸清楚,对照本文的兼容性列表,标出有差异的部分。
迁移------大部分代码直接搬,有差异的部分单独改写。用exp/imp导Schema和数据,用验证脚本确认完整性。
测试------重点测那几个有坑的函数(CHR、CONVERT、正则),跑一遍完整的业务回归测试。
记住一条铁律:兼容率再高,那几个差异点不查清楚,上线迟早出事。 上线前把第九节的清单过一遍,过完了心里就有底了。