clickhouse 使用global in 优化 in查询

文章目录

      • in例子
      • [使用global in](#使用global in)

in例子

bash 复制代码
SELECT uniq(UserID) FROM distributed_table
WHERE CounterID = 101500 
AND UserID IN (SELECT UserID FROM distributed_table WHERE CounterID = 34)

对于in 查询来说,本来查询的就是分布式表,假设这个表有100 个分片,in 查询就要查询100次,再加上外面也是查的分布式表,那就是100*100 次

bash 复制代码
SELECT UserID FROM distributed_table WHERE CounterID = 34

使用global in

bash 复制代码
SELECT uniq(UserID) FROM distributed_table
WHERE CounterID = 101500 
AND UserID  global IN (SELECT UserID FROM distributed_table WHERE CounterID = 34)

global in 实现

ClickHouse 会从右表的所有分片中读取完整数据,然后收集到的右表数据会被广播到查询涉及的每个分片上。

相当于右表里的只查询一次,大大减少处理时间

相关推荐
数据拾光者3 天前
AI那些趣事系列121:智能问数场景中使用ClickHouse处理离线3G大文件
clickhouse
飞火流星020273 天前
ClickHouse 最核心的三类表引擎‌ReplicatedMergeTree、Distributed 和 MergeTree 对比
clickhouse
piepis3 天前
ClickHouse 的高速查询原理
clickhouse
yashuk11 天前
clickhouse-介绍、安装、数据类型、sql
数据库·sql·clickhouse
百度Geek说13 天前
百度MEG数据中台ClickHouse在数据湖仓中的探索和应用
clickhouse·湖仓一体·lakehouse·数据引擎·存算分离
l1t13 天前
编译测试clickhouse-cpp客户端
c++·clickhouse
hopsky13 天前
ClickHouse SQL 在 Java 中的校验方法
java·sql·clickhouse
longxibo16 天前
【Ubuntu datasophon1.2.1 二开之八:验证实时数据入湖】
大数据·linux·clickhouse·ubuntu·linq
阿坤带你走近大数据25 天前
ClickHouse的介绍
clickhouse
南修子1 个月前
【Flink 30天】Day24-27 实时数仓规范:ODS→DWD→DWS→ADS 分层 + Temporal Join + 生产最佳实践
clickhouse·flink·实时数仓·数据分层·temporaljoin