4 redis的HyperLogLog入门&原理

一、HyperLogLog(字符串类型)

需求:大型网站(不在大厂基本上用不到) 每个网页每天的 UV 数据(独立访客),统计如何实现?(尽量少的占用存储空间)

  1. Redis 提供了 HyperLogLog 数据结构就是用来解决这种统计问题的。
  2. HyperLogLog 提供不精确的去重计数方案,虽然不精确但是也不是非常不精确,标准误差是 0.81%,这样的精确度已经可以满足上面的 UV统计需求了。

HyperLogLog提供了3个命令: pfadd、pfcount、pfmerge

1、百万级用户访问网站,单个页面的统计差异
2、Pfadd

Pfadd 命令将所有元素参数添加到 HyperLogLog 数据结构中

基本语法如下:

java 复制代码
redis 127.0.0.1:6379> PFADD key element [element ...]

返回值:

整型,如果至少有个元素被添加返回 1, 否则返回 0。

例如:统计2023-10-10的用户登录数量

java 复制代码
redis 127.0.0.1:6379> PFADD login:2023-10-10 p001 p002 p003 p004 p005 p006 
(integer) 1
redis 127.0.0.1:6379> PFCOUNT login:2023-10-10
(integer) 6
3、Pgmerge

Pgmerge 命令将多个 HyperLogLog 合并为一个 HyperLogLog。

合并后的 HyperLogLog 的基数估算值是通过对所有 给定 HyperLogLog 进行并集计算得出的。

java 复制代码
redis 127.0.0.1:6379> PFADD hll1 foo bar zap a
(integer) 1
redis 127.0.0.1:6379> PFADD hll2 a b c foo
(integer) 1
redis 127.0.0.1:6379> PFMERGE hll3 hll1 hll2
OK
redis 127.0.0.1:6379> PFCOUNT hll3		//取并集,且去重
(integer) 6
相关推荐
李白客9 分钟前
分布式交易型数据库:数字时代交易系统的“定海神针“
数据库·分布式
杨运交10 分钟前
[031][缓存模块]RedisTemplate工具的租户隔离设计:自动Key前缀机制
缓存
曹牧11 分钟前
Oracle:CHR的典型用法
数据库·oracle
我是一颗柠檬19 分钟前
【Java项目技术亮点】全链路分层限流:从网关到数据库的多层防护体系
java·开发语言·数据库
xhtdj29 分钟前
技术采用曲线回望二十年
运维·数据库·人工智能·clickhouse·动态规划
油炸自行车1 小时前
【bug】Qt 6 Q_NAMESPACE 跨 DLL 链接错误:LNK2019 无法解析 staticMetaObject
数据库·c++·qt·bug·link2019·q_namespace_exp·namespaceexport
Arvin.Angela1 小时前
MySQL安装及运行环境配置
数据库·mysql·adb
西凉的悲伤1 小时前
Spring Boot 中 RedisTemplate 与 StringRedisTemplate 常用 Redis API 速查
spring boot·redis·后端·redistemplate·stringredis
Dovis(誓平步青云)1 小时前
《QT学习第五篇:QSS美化界面与API绘图》
开发语言·数据库·qt·学习·时序数据库·开源智能体
焦虑的说说1 小时前
mysql深分页性能瓶颈根源分析
数据库·mysql