GaussDB数据库中的MERGE INTO介绍

++一、前言++

++[二、GaussDB MERGE INTO 语句的原理概述](#二、GaussDB MERGE INTO 语句的原理概述)++

++[1、MERGE INTO 语句原理](#1、MERGE INTO 语句原理)++

++[2、MERGE INTO 的语法](#2、MERGE INTO 的语法)++

++3、语法解释++

++[三、GaussDB MERGE INTO 语句的应用场景](#三、GaussDB MERGE INTO 语句的应用场景)++

++[四、GaussDB MERGE INTO 语句的示例](#四、GaussDB MERGE INTO 语句的示例)++

++1、示例场景举例++

++2、示例实现过程++

++1）创建两个实验表，并初始化测试数据++

++[2）更新 target_table 中的销售数据，并插入新的销售记录。](#2）更新 target_table 中的销售数据，并插入新的销售记录。)++

++3）查看并比对执行结果++

++五、小结++

一、前言

随着数据量的爆炸性增长，数据库管理系统（DBMS）的功能和性能要求也在不断提升。GaussDB 作为一款先进的关系型数据库管理系统，其 MERGE INTO 语句在数据整合、更新操作中发挥了重要作用。MERGE INTO 语句允许用户在单次操作中执行插入和更新操作，大大提高了数据处理效率。本文将举例为大家讲述 GaussDB 中 MERGE INTO 语句的使用。

二、GaussDB MERGE INTO 语句的原理概述

1、MERGE INTO 语句原理

GaussDB 的 MERGE INTO 语句是基于 SQL 标准的，通过单个SQL语句实现了数据的UPDATE和INSERT操作。该语句在执行时，会根据指定的条件比较源表和目标表的数据。当源表和目标表中数据针对关联条件可以匹配上时，则进行UPDATE操作；当源表和目标表中数据针对关联条件无法匹配时，则进行INSERT操作。这种操作方式减少了数据传输的开销，避免多次执行，提高了数据处理的效率。

2、MERGE INTO 的语法

sql 复制代码

MERGE [/*+ plan_hint */] INTO table_name [ partition_clause ] [ [ AS ] alias ]
USING { { table_name | view_name } | subquery } [ [ AS ] alias ]
ON ( condition )
[
  WHEN MATCHED THEN
  UPDATE SET { column_name = { expression | subquery | DEFAULT } |
          ( column_name [, ...] ) = ( { expression | subquery | DEFAULT } [, ...] ) } [, ...]
  [ WHERE condition ]
]
[
  WHEN NOT MATCHED THEN
  INSERT { DEFAULT VALUES |
  [ ( column_name [, ...] ) ] VALUES ( { expression | subquery | DEFAULT } [, ...] ) [, ...] [ WHERE condition ] }
];

where partition_clause can be:
PARTITION { ( partition_name ) | FOR ( partition_value [, ...] ) } |
SUBPARTITION { ( subpartition_name ) | FOR ( subpartition_value [, ...] ) }
NOTICE: 'partition_clause' is only avaliable in CENTRALIZED mode!
NOTICE: 'subquery' in the UPDATE and INSERT clauses are only avaliable in CENTRALIZED mode!

3、语法解释

**权限：**进行MERGE INTO操作的用户需要同时拥有目标表的UPDATE和INSERT权限，以及源表的SELECT权限。
plan_hint **子句：**可选，以/*+ */的形式在MERGE关键字后，用于对MERGE对应的语句块生成的计划进行hint调优
INTO talbe_name **：**指定正在更新或插入的目标表。
USING **子句：**指定源表，源表可以为表、视图或子查询。
ON **子句：**关联条件，用于指定目标表和源表的关联条件。不支持更新关联条件中的字段。
WHEN MATCHED / WHEN NOT MATCHED **子句：**不支持INSERT子句中包含多个VALUES。WHEN MATCHED和WHEN NOT MATCHED子句顺序可以交换，可以缺省其中一个，但不能同时缺省，不支持同时指定两个WHEN MATCHED或WHEN NOT MATCHED子句。
DEFAULT **：**用对应字段的缺省值填充该字段。如果没有缺省值，则为NULL。
WHERE condition **：**UPDATE子句和INSERT子句的条件，只有在条件满足时才进行更新操作，可缺省。不支持WHERE条件中引用系统列。

三、GaussDB MERGE INTO 语句的应用场景

MERGE INTO 语句在多种场景中都有广泛的应用。例如，在数据迁移 过程中，可以使用 MERGE INTO 语句将源数据库中的数据迁移到目标数据库，同时保证数据的完整性和一致性。此外，在数据整合 、ETL 过程、实时数据处理等场景中，MERGE INTO 语句都能发挥其高效的数据处理能力。

四、GaussDB MERGE INTO 语句的示例

1、示例场景举例

假设我们有两个表：source_table 和 target_table。source_table 包含最新的销售数据，而 target_table 存储历史销售数据。我们的目标是更新 target_table 中的销售数据，并插入新的销售记录。

2、示例实现过程

以下是使用 GaussDB MERGE INTO 语句的实现示例

1）创建两个实验表，并初始化测试数据

sql 复制代码

--创建测试表target_table,存储历史销售数据
CREATE TABLE public.target_table
(
  product_id VARCHAR(20),
  product_name VARCHAR(20),
  sales_sum_number INT,
  sales_sum_amount MONEY,
  create_date VARCHAR(8),
  update_date VARCHAR(8)
);

--插入测试数据
INSERT INTO public.target_table(product_id,product_name,sales_sum_number,sales_sum_amount,create_date,update_date) VALUES('P1001','books',100,1000,'20240101','30001231');
INSERT INTO public.target_table(product_id,product_name,sales_sum_number,sales_sum_amount,create_date,update_date) VALUES('P1002','pens',200,400,'20240102','30001231');

--创建测试表source_table,包含最新的销售数据
CREATE TABLE public.source_table
(
  product_id VARCHAR(20),
  product_name VARCHAR(20),
  sales_sum_number INT,
  sales_sum_amount MONEY,
  create_date VARCHAR(8)
);

--插入测试数据
INSERT INTO public.source_table(product_id,product_name,sales_sum_number,sales_sum_amount,create_date) VALUES('P1001','books',50,500,'20240103');
INSERT INTO public.source_table(product_id,product_name,sales_sum_number,sales_sum_amount,create_date) VALUES('P1003','toys',100,1000,'20240103');

--查看结果
SELECT * FROM public.target_table;
SELECT * FROM public.source_table;

2）更新 target_table 中的销售数据，并插入新的销售记录。

sql 复制代码

--更新 target_table 中的销售数据，并插入新的销售记录。
MERGE INTO target_table AS t  
USING source_table AS s  
ON (t.product_id = s.product_id)  
WHEN MATCHED THEN  
    UPDATE SET t.sales_sum_number=t.sales_sum_number + s.sales_sum_number,t.sales_sum_amount = t.sales_sum_amount + s.sales_sum_amount,t.update_date = s.create_date
WHEN NOT MATCHED THEN  
INSERT (product_id,product_name,sales_sum_number,sales_sum_amount,create_date,update_date) VALUES (s.product_id,s.product_name,s.sales_sum_number,s.sales_sum_amount,s.create_date,'30001231');

--查看执行结果
SELECT * FROM public.target_table;

3）查看并比对执行结果

更新之前的目标表target_table ：

源表source_table:

更新之后的目标表target_table ：

上述示例中，我们通过 MERGE INTO 语句将 source_table 中的销售数据与 target_table 中的数据进行匹配。在目标中，产品"P1001"销售数量增加了50，销售金额增加了500，更新日期更新为源表中的创建日期。产品"P1002"的销售数据没有变化。产品"P1003"作为一条新的销售数据插入到了历史表（目标表）中。这样，我们就轻松地将最新的销售数据整合到 target_table 中，同时保持数据的完整性和一致性。

**特别说明：**在实际业务操作时，需要提前做好规划，确保执行的准确定、数据的准确性以及数据的安全性，同时做好各个环节的备份等操作。

五、小结

MERGE INTO 语句在GaussDB数据库中是一个非常好用、方便的SQL工具。同时，在数据处理工作中起着非常重要的作用，它能够提高数据处理效率，简化数据处理流程，满足各种数据处理需求。本文通过在GaussDB数据库中模拟了一则简单的示例为大家进行了讲解，希望可以帮助读者更好的理解与使用。

------结束