思路:所有用户 = 活跃用户 + 回流用户。
方法一:
1.回流即N天以上未活跃过的用户,这个量级太大,所以要取反,去记录最近N天活跃过的用户uid。
2.使用redis存储,set类型,每天都分为1024个key,这样1天内活跃百万级别用户,单个key平均在1000左右,不会出现大key的情况。【数据每天导出一次】
3.set类型 key=prefix_yesterday_分片index,ttl = 1d。
4.考虑异常情况,可以将它存到今天一份,key=prefix_today_分片index,ttl=2d。
5.查询时直接查prefix_yesterday_分片index。sismember命令。
方法二:
1.查询用户最近7天登录的日期(排除掉今天)。