mysql distinct慢

tebukaopu1482025-12-07 13:54

select a , count(distinct b) cn from t

如果统计是死的或者实时性要求没这么高，那么可以用各种手段做缓存。

如果统计是实时的并且数据量不大，几十万的数据量

Stream API一行式（Java 8+）

css 复制代码

Map<String, Long> result = dataList.stream()
    .collect(Collectors.groupingBy(
        Vo::getA,
        Collectors.mapping(
            Vo::getB,
            Collectors.collectingAndThen(
                Collectors.toSet(),
                Set::size
            )
        )
    ));

并行处理版（大数据量）

css 复制代码

Map<String, Integer> result = dataList.parallelStream()
    .collect(
        Collectors.groupingByConcurrent(
            Vo::getA,
            Collectors.mapping(
                Vo::getB,
                Collectors.toSet()
            )
        )
    )
    .entrySet().stream()
    .collect(Collectors.toMap(
        Map.Entry::getKey,
        e -> e.getValue().size()
    ));

如果要求实时统计数据量又很大，几千万甚至过亿数据量，上 Elasticsearch

如果要求实时统计数据量更大，过亿甚至接近无限，上Flink

上一篇：多模态视觉语言模型增强原生分辨率继续预训练方法-COMP架构及训练方法

下一篇：前端html(2)