黑马点评-UV统计

UV、PV

但UV统计在服务器端实现会很麻烦,因为要判断过该用户是否统计过了,需要将统计过的用户信息进行保存,若将所有访问过的用户都存储在redis,会消耗大量的内存,所以redis中HyperLogLog

HyperLogLog

hyperloglog是从loglog算法派生出的概率算法,用于确定非常大的集合的基数,而不需要存储其所有值。HLL是基于String结构实现的,单个HLL的内存永远小于16kb,内存占用及其小, 但由于它的测量结果是由概率性的,小于0.81%的误差,但完全可以忽略不计,同时HLL里面的元素是不可重复的,即使相同的用户连续访问,也只记录一次该用户

相关命令

PFADD插入的是用户的id,用于统计,PFMERGE用于合并,可以合并一周的,一个月的,一年的记录的数据

可以看到,重复记录了元素e1,e2,e3..但之后记录一次

模拟UV统计

java 复制代码
    @Test
    void testHyperLogLog() {
        //定义一个长度1000的数组
        String[] values = new String[1000];
        int j = 0;
        for (int i = 0; i < 1000000; i++) {
            //进行一百万次的循环,但每次都只会记录0-999的数据,超过999就会被j进行取余操作,
            j = i % 1000;
            values[j] = "user_" + i;
            if(j == 999){
                // 每当数组满了,就发送到Redis一次,直至发送了一百万次数据
                stringRedisTemplate.opsForHyperLogLog().add("hl2", values);
            }
        }
        // 统计数量
        Long count = stringRedisTemplate.opsForHyperLogLog().size("hl2");
        System.out.println("count = " + count);
    }

输出

误差在0.22%左右,并且内存大概占用14kb左右

相关推荐
砍材农夫14 小时前
python环境|pip|uv|venv|Conda区别
后端·python·conda·pip·uv
jingqiulyue1 天前
uv sync 找不到uv怎么办
uv
love530love1 天前
2026年终极防坑指南:基于 EPGF 架构彻底“本地化” UV 环境与工具
人工智能·windows·python·架构·devops·uv·epgf
砍材农夫3 天前
python 如何一次性安装项目所有依赖包(pip和uv)
开发语言·python·pip·uv
文创工作室4 天前
三维模型展UV软件 RizomUV Virtual Space 2022.0.11 中文汉化
uv·rizomuv
SHIPKING3935 天前
【UV】从入门到实战
uv
GDAL5 天前
使用 uv 管理 Python 版本
python·uv·版本
CG_MAGIC6 天前
从光影到物理渲染:Substance Sampler 照片转材质
3d·材质·贴图·uv·建模教程·渲云渲染
GDAL7 天前
uv 完整教程:下一代 Python 包管理工具
python·uv
kke_888 天前
一年12个月,小程序UV的季节性波动规律
大数据·小程序·uv