[Clickhouse] Clickhouse 报SQLException : Read timed out

1 问题描述

在使用Clickhouse(21.3.4.25)进行大数据量地数据查询,高频报出 SQLException : Read timed out 错误

2 问题分析

2.1 单次查询:耗时约4s

2.2 并发20查询:报SQLException Read timeout,并发5查询:正常

2.3 整个SQL :查询业务逻辑复杂(多层嵌套、Join、200余行)

2.4 整个Query SQL 的查询基表:基于1个36亿级(6W Inner Join 6W)的视图表

2.x 问题结论及优化方向

  • 根本原因:
  • SQL逻辑和所消耗的资源较高,达到了CK数据库的资源、性能瓶颈。(Clickhouse本身也不支持高并发查询,官网/最佳实践的建议:单表查询,尽可能减少join、最高单表并发100)
  • 个人优化建议:
  • 1、优化SQL(可结合物化视图,如果担心统计不准(大部分情况下,误差概率极低、较小),可先主动执行 optimze table {table} final 指令做合并,再执行 Query SQL)
  • 2、尝试调整连接参数(如:?socket_timeout=600000,能一定程度上减少此类报错)
由于数据量过大,查询请求太久,导致clickhouse连接超时。
建议在clickhouse连接字符串后面加上参数:`?socket_timeout=600000`再验证
socket_timeout的单位是ms,可以根据实际情况更改大小。

X 参考文献

  • clickhouse
相关推荐
武子康11 小时前
大数据-141 - ClickHouse 集群 副本和分片 Zk 的配置 Replicated MergeTree原理详解
java·大数据·clickhouse·flink·spark·scala
武子康17 小时前
大数据-143 - ClickHouse 集群 SQL 超详细实践记录!
java·大数据·数据库·分布式·sql·clickhouse·flink
goTsHgo2 天前
从底层原理上解释 ClickHouse 的索引
大数据·clickhouse
Hello.Reader2 天前
ClickHouse 与 Quickwit 集成实现高效查询
python·clickhouse·django·全文检索
武子康2 天前
大数据-133 - ClickHouse 基础概述 全面了解
java·大数据·分布式·clickhouse·flink·spark
Casual_Lei2 天前
ClickHouse 的底层架构和原理
clickhouse·架构
码爸3 天前
flink 批量写clickhouse
java·clickhouse·flink
goTsHgo3 天前
从底层原理上解释 clickhouse 保证完全的幂等性
数据库·clickhouse
小王是个弟弟4 天前
ClickHouse-Kafka Engine 正确的使用方式
clickhouse·kafka
武子康4 天前
大数据-134 - ClickHouse 集群三节点 安装配置启动
java·大数据·分布式·clickhouse·架构·flink