clickhouse 使用global in 优化 in查询

文章目录

      • in例子
      • [使用global in](#使用global in)

in例子

bash 复制代码
SELECT uniq(UserID) FROM distributed_table
WHERE CounterID = 101500 
AND UserID IN (SELECT UserID FROM distributed_table WHERE CounterID = 34)

对于in 查询来说,本来查询的就是分布式表,假设这个表有100 个分片,in 查询就要查询100次,再加上外面也是查的分布式表,那就是100*100 次

bash 复制代码
SELECT UserID FROM distributed_table WHERE CounterID = 34

使用global in

bash 复制代码
SELECT uniq(UserID) FROM distributed_table
WHERE CounterID = 101500 
AND UserID  global IN (SELECT UserID FROM distributed_table WHERE CounterID = 34)

global in 实现

ClickHouse 会从右表的所有分片中读取完整数据,然后收集到的右表数据会被广播到查询涉及的每个分片上。

相当于右表里的只查询一次,大大减少处理时间

相关推荐
雨中飘荡的记忆1 小时前
ClickHouse_实战指南
clickhouse
云闲不收1 天前
clickhouse hbase Hive 区别
hive·clickhouse·hbase
f***01934 天前
clickhouse-介绍、安装、数据类型、sql
数据库·sql·clickhouse
j***63086 天前
clickhouse-介绍、安装、数据类型、sql
数据库·sql·clickhouse
IT油腻大叔9 天前
MySQL VS ClickHouse 索引结构对比分析
mysql·clickhouse
-KamMinG9 天前
解决 ClickHouse 备份性能问题:从原生 BACKUP 迁移到 clickhouse-backup 的实战经验
clickhouse
2301_8075832313 天前
ubuntu22.04集群部署clickhouse详细步骤
linux·clickhouse·zookeeper
Azure++15 天前
Centos安装clickhouse
linux·clickhouse·centos
阳爱铭18 天前
ClickHouse 中至关重要的两类复制表引擎——ReplicatedMergeTree和 ReplicatedReplacingMergeTree
大数据·hive·hadoop·sql·clickhouse·spark·hbase