mysql distinct慢

select a , count(distinct b) cn from t

如果统计是死的或者实时性要求没这么高,那么可以用各种手段做缓存。

如果统计是实时的并且数据量不大,几十万的数据量

Stream API一行式(Java 8+)

css 复制代码
Map<String, Long> result = dataList.stream()
    .collect(Collectors.groupingBy(
        Vo::getA,
        Collectors.mapping(
            Vo::getB,
            Collectors.collectingAndThen(
                Collectors.toSet(),
                Set::size
            )
        )
    ));

并行处理版(大数据量)

css 复制代码
Map<String, Integer> result = dataList.parallelStream()
    .collect(
        Collectors.groupingByConcurrent(
            Vo::getA,
            Collectors.mapping(
                Vo::getB,
                Collectors.toSet()
            )
        )
    )
    .entrySet().stream()
    .collect(Collectors.toMap(
        Map.Entry::getKey,
        e -> e.getValue().size()
    ));

如果要求实时统计数据量又很大,几千万甚至过亿数据量, 上 Elasticsearch

如果要求实时统计数据量更大,过亿甚至接近无限,上Flink

相关推荐
m0_702036536 分钟前
防止SQL注入的运维实践_实时清理数据库缓存与历史记录
jvm·数据库·python
2301_779622418 分钟前
Redis怎样合并多天访客数据_通过PFMERGE指令聚合HyperLogLog记录
jvm·数据库·python
m0_748554819 分钟前
如何监控集群 interconnect_ping与traceroute验证心跳通畅
jvm·数据库·python
2301_7756398910 分钟前
Redis怎样查询集群的整体健康状态_使用cluster info指令查看槽位覆盖率与节点状态
jvm·数据库·python
zhoutongsheng11 分钟前
CSS如何处理带有状态切换的折叠菜单_利用BEM修饰符管理状态
jvm·数据库·python
dfdfadffa13 分钟前
Redis怎样配置基础连接参数
jvm·数据库·python
2301_7820404514 分钟前
golang如何实现图片水印批量添加_golang图片水印批量添加实现策略
jvm·数据库·python
夏恪15 分钟前
Redis如何利用Redisson处理并发击穿
jvm·数据库·python
2401_8504916522 分钟前
如何处理SQL注入敏感源_记录所有不安全的SQL请求
jvm·数据库·python
彳亍10122 分钟前
如何防御SQL注入的SQL畸形查询_利用语法分析器检测
jvm·数据库·python