clickhouse 使用global in 优化 in查询

文章目录

      • in例子
      • [使用global in](#使用global in)

in例子

bash 复制代码
SELECT uniq(UserID) FROM distributed_table
WHERE CounterID = 101500 
AND UserID IN (SELECT UserID FROM distributed_table WHERE CounterID = 34)

对于in 查询来说,本来查询的就是分布式表,假设这个表有100 个分片,in 查询就要查询100次,再加上外面也是查的分布式表,那就是100*100 次

bash 复制代码
SELECT UserID FROM distributed_table WHERE CounterID = 34

使用global in

bash 复制代码
SELECT uniq(UserID) FROM distributed_table
WHERE CounterID = 101500 
AND UserID  global IN (SELECT UserID FROM distributed_table WHERE CounterID = 34)

global in 实现

ClickHouse 会从右表的所有分片中读取完整数据,然后收集到的右表数据会被广播到查询涉及的每个分片上。

相当于右表里的只查询一次,大大减少处理时间

相关推荐
在路上走着走着4 天前
clickhouse数据库,http请求访问,支持参数化
数据库·clickhouse·http
爱上口袋的天空5 天前
09 - Clickhouse的SQL操作
数据库·sql·clickhouse
爱上口袋的天空8 天前
06 - Clickhouse的表引擎
数据库·clickhouse
吹老师个人app编程教学9 天前
ClickHouse的介绍、安装、数据类型
数据库·clickhouse·oracle
有被蠢哭到9 天前
Python连接Mysql、Postgre、ClickHouse、Redis常用库及封装方法
redis·python·mysql·clickhouse·postgresql
genghongsheng9 天前
执行flink sql连接clickhouse库
数据库·clickhouse·flink
爱上口袋的天空10 天前
04 - Clickhouse-21.7.3.14-2单机版安装
linux·服务器·clickhouse
LanFengXuXue10 天前
Clickhouse集群新建用户、授权以及remote权限问题
数据库·clickhouse
期待着201318 天前
ClickHouse创建分布式表
数据库·clickhouse