springboot集成guava布隆过滤器

1.创建springboot项目,引入maven依赖

bash 复制代码
		<dependency>
			<groupId>com.google.guava</groupId>
			<artifactId>guava</artifactId>
			<version>23.0</version>
		</dependency>

2.创建guava布隆过滤器

bash 复制代码
@Component
public class GuavaFilter {
    //初始化一个常量
    public static final int _1W = 10000;
    //初始化guava过滤器的容器容量
    public static final int SIZE = 100 * _1W;
    //误报率
    public static double  fpp = 0.03;  //误报率
    //创建一个guava过滤器
    public static BloomFilter bloomFilter = BloomFilter.create(Funnels.integerFunnel(),SIZE,fpp);


    //向guava过滤器中添加100万个数据
    //验证不在这100万数据之外的10万个数据的误判率
    @PostConstruct
    public void guavaFilter(){
        for(int i=1;i<=SIZE;i++){
            bloomFilter.put(i);
        }
        List<Integer> list = new ArrayList<>();
        for(int i = SIZE+1;i<SIZE+10*_1W;i++){
            if(bloomFilter.mightContain(i)){
                System.out.println(i + "被误识别了");
                list.add(i);
            }
        }
        System.out.println("误识别个数为:" + list.size());
    }
}

3.启动程序,观察结果

误识别的个数为3033个,误识别率3033/1000000≈0.03

4.对于误判率的思考

代码里配置的误判率为0.03,这里就会有小伙伴问,误判率(hash冲突概率)不应该越低越好吗,那我配置成0.01或者0.00000000001可以吗?

我们debug一下guava布隆过滤器的源码,点进去这个creat方法,断点打到如下图所示的位置

我们先看误报率配置0.03的情况

想要误报率控制在0.03,比特数组的位数需要达到7298440并且使用5种hash算法

再看误报率配置0.01的情况

想要误报率控制在0.01,比特数组的位数需要达到9585058并且使用7种hash算法

再看误报率配置0.00000000001的情况

想要误报率控制在0.00000000001,比特数组的位数需要达到52717821并且使用37种hash算法

当我们把误报率配置成0.00000000001,重新启动下程序

5.布隆过滤器的数据流向

相关推荐
王码码203514 分钟前
Go语言的测试:从单元测试到集成测试
后端·golang·go·接口
王码码203519 分钟前
Go语言中的测试:从单元测试到集成测试
后端·golang·go·接口
嵌入式×边缘AI:打怪升级日志1 小时前
使用JsonRPC实现前后台
前端·后端
小码哥_常2 小时前
从0到1:Spring Boot 中WebSocket实战揭秘,开启实时通信新时代
后端
lolo大魔王2 小时前
Go语言的异常处理
开发语言·后端·golang
IT_陈寒4 小时前
Python多进程共享变量那个坑,我差点没爬出来
前端·人工智能·后端
码事漫谈4 小时前
2026软考高级·系统架构设计师备考指南
后端
AI茶水间管理员5 小时前
如何让LLM稳定输出 JSON 格式结果?
前端·人工智能·后端
其实是白羊6 小时前
我用 Vibe Coding 搓了一个 IDEA 插件,复制URI 再也不用手动拼了
后端·intellij idea
用户8356290780516 小时前
Python 操作 Word 文档节与页面设置
后端·python