springboot集成guava布隆过滤器

1.创建springboot项目,引入maven依赖

bash 复制代码
		<dependency>
			<groupId>com.google.guava</groupId>
			<artifactId>guava</artifactId>
			<version>23.0</version>
		</dependency>

2.创建guava布隆过滤器

bash 复制代码
@Component
public class GuavaFilter {
    //初始化一个常量
    public static final int _1W = 10000;
    //初始化guava过滤器的容器容量
    public static final int SIZE = 100 * _1W;
    //误报率
    public static double  fpp = 0.03;  //误报率
    //创建一个guava过滤器
    public static BloomFilter bloomFilter = BloomFilter.create(Funnels.integerFunnel(),SIZE,fpp);


    //向guava过滤器中添加100万个数据
    //验证不在这100万数据之外的10万个数据的误判率
    @PostConstruct
    public void guavaFilter(){
        for(int i=1;i<=SIZE;i++){
            bloomFilter.put(i);
        }
        List<Integer> list = new ArrayList<>();
        for(int i = SIZE+1;i<SIZE+10*_1W;i++){
            if(bloomFilter.mightContain(i)){
                System.out.println(i + "被误识别了");
                list.add(i);
            }
        }
        System.out.println("误识别个数为:" + list.size());
    }
}

3.启动程序,观察结果

误识别的个数为3033个,误识别率3033/1000000≈0.03

4.对于误判率的思考

代码里配置的误判率为0.03,这里就会有小伙伴问,误判率(hash冲突概率)不应该越低越好吗,那我配置成0.01或者0.00000000001可以吗?

我们debug一下guava布隆过滤器的源码,点进去这个creat方法,断点打到如下图所示的位置

我们先看误报率配置0.03的情况

想要误报率控制在0.03,比特数组的位数需要达到7298440并且使用5种hash算法

再看误报率配置0.01的情况

想要误报率控制在0.01,比特数组的位数需要达到9585058并且使用7种hash算法

再看误报率配置0.00000000001的情况

想要误报率控制在0.00000000001,比特数组的位数需要达到52717821并且使用37种hash算法

当我们把误报率配置成0.00000000001,重新启动下程序

5.布隆过滤器的数据流向

相关推荐
生活真难3 分钟前
SpringCloud - 任务调度 - xxl-job-java
java·spring boot·spring cloud
数据小馒头20 分钟前
SQL与数据库开发(三):MySQL 原生 JSON 操作实战
后端
盏灯40 分钟前
以前有一个同事说:最讨厌下班提需求又没电脑在身边...
前端·后端·面试
人道领域41 分钟前
【黑马点评日记】:用户签到功能详解——从Bitmap入门到避坑指南
java·数据库·redis·后端
蓝眸少年CY1 小时前
Scala - 基础教程
开发语言·后端·scala
Kiyra1 小时前
从上传到可问答:Interview Agent 的知识库 RAG 链路
java·人工智能·后端·spring·职场和发展
泽_浪里白条1 小时前
superset 踩过的坑之嵌入式 Dashboard 数据筛选
前端·后端
cpp_learner1 小时前
QT 使用 QXlsx 时遇到包含 <private/qzipreader_p.h> 和 <private/qzipreader_p.h> 错误的解决方案
后端
AI人工智能+电脑小能手1 小时前
【大白话说Java面试题】【Java基础篇】第39题:说说反射的用途及实现原理,Java获取反射(Class)的三种方法
java·开发语言·后端·python·面试
PeterLi1 小时前
踩坑实录:JRebel 启动报 Mapper 重复 ID 异常,IDEA 普通启动却正常?
java·后端