【Databend】多表联结,你不会还没有掌握吧!

文章目录

概述和数据准备

多表联结是两个或多个表的列合并到一个结果集中。Databend 中支持的连接类型有 inner join 、cross join 、natural join 、left join 、right join 、left anti join 、right anti join 、full outer join。

在这里我们只讲最常见的几种,其中 inner join 、left join 、right join 最常用。

数据准备:

sql 复制代码
drop table if exists vip_info;
create table if not exists vip_info (
    client_id int,
    region varchar
);
drop table if exists purchase_records;
create table if not exists purchase_records (
    client_id int,
    item varchar,
    qty int
);
drop table if exists gift;
create table if not exists gift (
    gift varchar
);

insert into vip_info values
    (101, 'Toronto'),
    (102, 'Quebec'),
    (103, 'Vancouver');

insert into purchase_records values
    (100, 'Croissant', 2000),
    (102, 'Donut', 3000),
    (103, 'Coffee', 6000),
    (106, 'Soda', 4000);

insert into gift values
    ('Croissant'),
    ('Donut'),
    ('Coffee'),
    ('Soda');  

内连接

内连接使用 inner join 语法,其中 inner 可以省略,返回满足结果集中连接条件的行。当列相同时,可以将 on 转化成 using 来简化语法。

需求:根据准备的数据,返回VIP客户的购买记录。

sql 复制代码
select t2.client_id
     , t2.item
     , t2.qty
from vip_info as t1
         join purchase_records as t2
              using (client_id);

交叉连接

交叉连接使用 cross join 语法,也可以使用 inner join 不加连接条件实现,返回一个结果集,该结果集包括第一个表中的每一行,与第二个表中的每一行连接。

需求:将每个礼品选项分配给每个VIP客户。

sql 复制代码
-- 方法一:使用 cross join
select t1.*,t2.*
from vip_info as t1
         cross join gift as t2;
-- 方法二:使用 inner join 但是没有加匹配条件
select t1.*,t2.*
from vip_info as t1
         join gift as t2;

左连接

左连接使用 left join 语法,返回左表中的所有记录,以及右表中的匹配记录。如果没有匹配,结果是右侧的 NULL 记录。

需求:返回所有VIP客户的购买记录,如果VIP客户没有购买,购买记录将为 NULL。

sql 复制代码
select t1.*,t2.*
from vip_info as t1
        left join purchase_records as t2
              using (client_id); 

右连接

左连接使用 right join 语法,返回右表中的所有记录,以及左表中匹配的记录。如果没有匹配,结果是左侧的 NULL 记录。

需求:返回所有客户的购买记录,如果不是VIP客户,VIP客户信息将为 NULL。

sql 复制代码
select t1.*,t2.*
from vip_info as t1
        right join purchase_records as t2
              on t1.client_id = t2.client_id;  

左反和右反连接

左侧反连接使用 left anti join 语法,从左侧表中返回右侧表中没有匹配行的行。这是 Databend 的语法,建议使用 left join 配合 where 实现。

sql 复制代码
-- 方法一:使用 left anti join 实现,只能返回 t1 表的信息
select *
from vip_info as t1
        left anti join purchase_records as t2
              on t1.client_id = t2.client_id;   
-- 方法二:使用 left join 配合 where 实现
select t1.*, t2.*
from vip_info as t1
         left join purchase_records as t2
                   on t1.client_id = t2.client_id
where t2.client_id is null;    
+-----------+---------+-----------+------+-----+
| client_id |  region | client_id | item | qty |
+-----------+---------+-----------+------+-----+
|     101   | Toronto |    NULL   | NULL | NULL|
+-----------+---------+-----------+------+-----+ 

右反连接使用 right anti join 语法,从右表返回左表中没有匹配行的行。这是 Databend 的语法,建议使用 left join 配合 where 实现。

sql 复制代码
-- 方法一:使用 left anti join 实现,只能返回 t1 表的信息
select *
from vip_info as t1
        right anti join purchase_records as t2
              on t1.client_id = t2.client_id;   
-- 方法二:使用 left join 配合 where 实现
select t1.*, t2.*
from vip_info as t1
         right join purchase_records as t2
                   on t1.client_id = t2.client_id
where t1.client_id is null;    
+-----------+---------+-----------+-----------+-----+
| client_id |  region | client_id |    item   | qty |
+-----------+---------+-----------+-----------+-----+
|    NULL   |   NULL  |    100    | Croissant | 2000|
+-----------+---------+-----------+-----------+-----+ 
|    NULL   |   NULL  |    106    |    Soda   | 4000|
+-----------+---------+-----------+-----------+-----+

全连接

全连接使用 full outer join 返回两个表中的所有行,在可以匹配的地方匹配行,并在不存在匹配行的地方放置NULL。

sql 复制代码
-- 方法一:使用 full outer join 语法
select t1.*, t2.*
from vip_info as t1
         full outer join purchase_records as t2
                   on t1.client_id = t2.client_id;
-- 方法二:使用 left join、right join 和 union 实现
select t1.*, t2.*
from vip_info as t1
         left join purchase_records as t2
                   on t1.client_id = t2.client_id
union
select t1.*, t2.*
from vip_info as t1
         right join purchase_records as t2
                    on t1.client_id = t2.client_id;

总结

多表联结语法很简单,不同数据库可能语法不一样,但只要掌握 inner join、left join 、right join 三种语法,配合 where 或者 union 基本上可以解决所有相关的多表连接问题,赶紧实践动起来。

参考资料:

相关推荐
桀桀桀桀桀桀9 分钟前
数据库中的用户管理和权限管理
数据库·mysql
lzhlizihang1 小时前
【Hive sql 面试题】求出各类型专利top 10申请人,以及对应的专利申请数(难)
大数据·hive·sql·面试题
Hsu_kk1 小时前
Hive 查询各类型专利 Top 10 申请人及对应的专利申请数
数据仓库·hive·hadoop
Tianyanxiao1 小时前
如何利用探商宝精准营销,抓住行业机遇——以AI技术与大数据推动企业信息精准筛选
大数据·人工智能·科技·数据分析·深度优先·零售
大数据编程之光1 小时前
Hive 查询各类型专利 top10 申请人及专利申请数
大数据·数据仓库·hive·hadoop
杰克逊的日记1 小时前
Hive详解
数据仓库·hive·hadoop
superman超哥1 小时前
04 深入 Oracle 并发世界:MVCC、锁、闩锁、事务隔离与并发性能优化的探索
数据库·oracle·性能优化·dba
用户8007165452001 小时前
HTAP数据库国产化改造技术可行性方案分析
数据库
engchina2 小时前
Neo4j 和 Python 初学者指南:如何使用可选关系匹配优化 Cypher 查询
数据库·python·neo4j
engchina2 小时前
使用 Cypher 查询语言在 Neo4j 中查找最短路径
数据库·neo4j