clickhouse使用问题记录

1、若一段时间内向数据库中插入多条相同的数据 ,只有第一条数据能插入成功---原因数据库有重复校验机制 一段时间有相同数据插入 不予执行

2、插入后立即查询,若数据库内存占用高,有概率查不出数据。---原因因多分片部署,数据库占用内存高,会查询部分分片内容就返回 若其中无数据 则返回无数据。

3、sql优化

两表关联使用Join 大表在前 小表在后

两表关联后条件有where 把where 改为and

两表关联后条件中有子查询 要把子查询放到where后

用以上方式修改后 查询速度会提升很多

4、select和from中字段 给字段起别名时 不要和表中字段一样 若一样查询结果会有问题 猜测:ck和关系型数据库查询顺序不同导致

5、数据库搭建采用分片式 执行 in join 时 前要增加 global

6、ck 对UNION ALL 支持不好 有时会查部分select就返回

7、一次性查询最好不要超过300万条数据 若大于 查询结果会很慢

相关推荐
大厂技术总监下海14 分钟前
用户行为分析怎么做?ClickHouse + 嵌套数据结构,轻松处理复杂事件
大数据·数据结构·数据库
alonewolf_9924 分钟前
深入理解MySQL事务与锁机制:从原理到实践
android·数据库·mysql
朝依飞41 分钟前
fastapi+SQLModel + SQLAlchemy2.x+mysql
数据库·mysql·fastapi
3***g2051 小时前
redis连接服务
数据库·redis·bootstrap
m0_598177231 小时前
SQL 方法函数(1)
数据库
oMcLin1 小时前
如何在Oracle Linux 8.4上通过配置Oracle RAC集群,确保企业级数据库的高可用性与负载均衡?
linux·数据库·oracle
信创天地1 小时前
核心系统去 “O” 攻坚:信创数据库迁移的双轨运行与数据一致性保障方案
java·大数据·数据库·金融·架构·政务
胖咕噜的稞达鸭1 小时前
进程间的通信(1)(理解管道特性,匿名命名管道,进程池,systeam V共享内存是什么及优势)重点理解代码!
linux·运维·服务器·数据库
德彪稳坐倒骑驴1 小时前
Sqoop入门常用命令
数据库·hadoop·sqoop
资深web全栈开发1 小时前
pg on delete 策略探讨
数据库·pg