clickhouse去重复数据解决方案

追梦者1232024-06-05 13:39

原因出现问题

因为我们的maxwell对接rabbitmq rabbitmq监听的是mysql的belog日志文件，所以mysql数据的实时操作都会同步数据到maxwell中

从而导致新增插入一条，修改插入一条，删除插入一条，导致同一条数据有大量的重复数据。

解决方案

在仪表板调用统计相关接口之前，先将重复数据处理掉

OPTIMIZE TABLE table_name FINAL

这样就可以根据order by (uuid) 的uuid去掉重复数据，保留最新的一条数据

上一篇：代码随想录算法训练营第一天| 704. 二分查找、27. 移除元素。

下一篇：富格林：具备可信方案畅顺出金

热门推荐

01GitHub 镜像站点 02BongoCat - 跨平台键盘猫动画工具 03UV安装并设置国内源 04GitLab 零基础入门指南：从安装到项目管理全流程 05Linux下V2Ray安装配置指南 06NVIDIA显卡驱动、CUDA、cuDNN 和 TensorRT 版本匹配指南 07一文了解国产算子编程语言 TileLang，TileLang 对国产开源生态的影响与启示 08在VSCode配置Java开发环境的保姆级教程（适配各类AI编程IDE）092025软件测试面试八股文（含答案+文档）10XXE 注入漏洞全解析：从原理到实战