mysql distinct慢

select a , count(distinct b) cn from t

如果统计是死的或者实时性要求没这么高,那么可以用各种手段做缓存。

如果统计是实时的并且数据量不大,几十万的数据量

Stream API一行式(Java 8+)

css 复制代码
Map<String, Long> result = dataList.stream()
    .collect(Collectors.groupingBy(
        Vo::getA,
        Collectors.mapping(
            Vo::getB,
            Collectors.collectingAndThen(
                Collectors.toSet(),
                Set::size
            )
        )
    ));

并行处理版(大数据量)

css 复制代码
Map<String, Integer> result = dataList.parallelStream()
    .collect(
        Collectors.groupingByConcurrent(
            Vo::getA,
            Collectors.mapping(
                Vo::getB,
                Collectors.toSet()
            )
        )
    )
    .entrySet().stream()
    .collect(Collectors.toMap(
        Map.Entry::getKey,
        e -> e.getValue().size()
    ));

如果要求实时统计数据量又很大,几千万甚至过亿数据量, 上 Elasticsearch

如果要求实时统计数据量更大,过亿甚至接近无限,上Flink

相关推荐
杀死那个蝈坦几秒前
短链接生成-基于布隆过滤器和唯一索引
java·数据库·微服务·oracle·rocketmq
winfield8213 分钟前
Java 中大量闲置 MySQL 连接的解决方案(从根因到落地)
java·mysql
计算机毕设指导66 分钟前
基于微信小程序图像识别的智能垃圾分类系统【源码文末联系】
java·spring boot·mysql·微信小程序·小程序·分类·maven
38242782716 分钟前
使用 webdriver-manager配置geckodriver
java·开发语言·数据库·爬虫·python
惜分飞1 小时前
Oracle Recovery Tools 使用说明
数据库·oracle·oracle恢复·替代bbed·oracle恢复工具
如旧呀1 小时前
爬虫小知识
数据库·爬虫·mysql
培根芝士1 小时前
解决DBeaver对PostgresSQL备份数据库时报错
数据库
Hello World呀1 小时前
登录时,redis出现错误
数据库·redis·缓存
企鹅侠客1 小时前
第02章—先导基础篇:初识Redis
数据库·redis·缓存
哈哈老师啊1 小时前
Springboot新冠检测信息管理系统10m6v(程序+源码+数据库+调试部署+开发环境)带论文文档1万字以上,文末可获取,系统界面在最后面。
数据库·spring boot·后端