ClickHouse中使用UNION

在 ClickHouse 中,UNION 用于合并两个或多个查询的结果集。ClickHouse 默认支持的是 UNION ALL,即合并结果集时不去重。如果需要使用 UNION DISTINCT(即合并结果集时去重),可以显式地指定。

UNION ALL

UNION ALL 不去重,直接合并结果集。

sql 复制代码
SELECT id, name FROM table1
UNION ALL
SELECT id, name FROM table2;

UNION DISTINCT

UNION DISTINCT 会对合并后的结果进行去重。

sql 复制代码
SELECT id, name FROM table1
UNION DISTINCT
SELECT id, name FROM table2;

示例表结构

假设有两个表 table1table2,它们的结构如下:

sql 复制代码
CREATE TABLE table1 (
    id UInt32,
    name String
) ENGINE = MergeTree()
ORDER BY id;

CREATE TABLE table2 (
    id UInt32,
    name String
) ENGINE = MergeTree()
ORDER BY id;

使用 UNION ALL 和 UNION DISTINCT 的示例

UNION ALL 示例

合并两个表的所有记录:

sql 复制代码
SELECT id, name FROM table1
UNION ALL
SELECT id, name FROM table2;
UNION DISTINCT 示例

合并两个表并去重:

sql 复制代码
SELECT id, name FROM table1
UNION DISTINCT
SELECT id, name FROM table2;

使用 ORDER BY 和 LIMIT

如果需要对合并后的结果进行排序或限制结果集的大小,可以在 UNION 后使用 ORDER BYLIMIT

UNION ALL 和 ORDER BY
sql 复制代码
SELECT id, name FROM table1
UNION ALL
SELECT id, name FROM table2
ORDER BY id;
UNION DISTINCT 和 LIMIT
sql 复制代码
SELECT id, name FROM table1
UNION DISTINCT
SELECT id, name FROM table2
LIMIT 10;

注意事项

  1. 列数和数据类型需要一致:每个子查询的列数和数据类型需要保持一致,否则会导致查询失败。
  2. 性能考虑UNION DISTINCT 需要对结果集去重,因此可能会比 UNION ALL 消耗更多的资源。

通过这些示例,你可以在 ClickHouse 中使用 UNION ALLUNION DISTINCT 来合并多个查询的结果集。

相关推荐
海南java第二人2 小时前
ClickHouse 实际应用类面试通关:项目案例、生产踩坑与实战经验
clickhouse·面试·实际应用类
meijinmeng1 天前
ClickHouse Kubernetes集群部署与维护文档
clickhouse
努力攻坚操作系统1 天前
ClickHouse详细教程
大数据·数据库·clickhouse
大帅点兵1 天前
设计一个金融交易监控系统
大数据·clickhouse·flink·spark·kafka·hbase
dinl_vin2 天前
FastAPI 系列 ·(十一):ClickHouse 集成——大数据查询实战
大数据·clickhouse·fastapi
麦兜和小可的舅舅3 天前
ClickHouse实时分布式集群设计方案选择探究
c++·分布式·clickhouse·kafka
海南java第二人4 天前
ClickHouse 性能优化完全指南:从数据模型到生产调优
clickhouse·性能优化
海南java第二人4 天前
ClickHouse 架构设计深度解析:分布式模型、高可用与选型对比
分布式·clickhouse·架构设计
l1t5 天前
DeepSeek总结的将 Rust Delta Kernel 集成到 ClickHouse
数据库·clickhouse·rust
灰太狼!!7 天前
数仓、接口开发常用clickhouses函数详解
数据仓库·sql·clickhouse