BitSet在阿里面试和RocketMQ中的应用

这里是weihubeats ,觉得文章不错可以关注公众号小奏技术

什么是BitSet

简单理解就是位图,类似BitMap。用来存储二进制位的类

BitSet特性

  • 位存储:BitSet 以位为单位存储数据,每个位只能是 0 或 1。
  • 空间效率:BitSet 比使用 boolean 数组存储二进制数据更节省空间。
  • 快速操作:BitSet 提供快速位操作方法,例如设置、清除、翻转和测试位。

使用场景

  • 布隆过滤器: 布隆过滤器是一种用于判断元素是否存在集合中的概率数据结构。
  • 位图索引: 位图索引可以用于快速查找和过滤数据。
  • 稀疏矩阵: 稀疏矩阵是指大多数元素为 0 的矩阵,可以使用 BitSet 来有效地存储稀疏矩阵。
  • 内存优化: 在需要节省内存的情况下,可以使用 BitSet 来存储二进制数据。

面试题

阿里面试题有这么一题:

有1千万个随机数,随机数的范围在1到1亿之间。现在要求写出一种算法,将1到1亿之间没有在随机数中的数求出来

这种就是类似使用布隆过滤器。我们最简单就可以使用BitSet

代码实现

java 复制代码
        int range = 10000000;
        Random random = new Random();
        List<Integer> list = new ArrayList<>(range);
        for (int i = 0; i < range; i++) {
            list.add(random.nextInt(range));
        }

        BitSet bitSet = new BitSet(range);
        for (Integer i : list) {
            bitSet.set(i);
        }
        for (int i = 0; i < 100000000; i++) {
            if (!bitSet.get(i)) {
                System.out.println(i);
            }
        }

RocketMQ中BitSet应用

pop消费中为了解决批量ack的问题引入了BitSet

通过org.apache.rocketmq.client.impl.MQClientAPIImpl#batchAckMessageAsync(java.lang.String, long, org.apache.rocketmq.client.consumer.AckCallback, java.lang.String, java.lang.String, java.util.List<java.lang.String>)方法批量设置消费位点在BitSet

然后在broker org.apache.rocketmq.broker.processor.AckMessageProcessor#appendAck中进行批量ack

这里简单解释下nextSetBit这个api。

BitSet.nextSetBit() 方法用于查找 BitSet 中从指定索引开始的第一个设置为 1 的位。如果找不到这样的位,则返回 -1

demo说明

java 复制代码
BitSet bitSet = new BitSet();
bitSet.set(2);
bitSet.set(5);
bitSet.set(9);

int index = bitSet.nextSetBit(0); // index = 2
index = bitSet.nextSetBit(3); // index = 5
index = bitSet.nextSetBit(6); // index = 9
index = bitSet.nextSetBit(10); // index = -1

实现原理

BitSet底层存是使用long数组实现的

所以BitSet的大小为long类型大小(64位)的整数倍。

默认不指定初始大小就是64

总结

总的来说BitSet在一些特定场景使用还是非常节省内存高效的

相关推荐
追逐时光者2 小时前
一款使用 C# 编写专为 Windows 11 打造的文件资源管理器增强工具!
后端·.net
风象南2 小时前
普通人用AI加持赚到的第一个100块
人工智能·后端
冰_河4 小时前
QPS从300到3100:我靠一行代码让接口性能暴涨10倍,系统性能原地起飞!!
java·后端·性能优化
JavaGuide6 小时前
7 道 RAG 基础概念知识点/面试题总结
前端·后端
桦说编程6 小时前
从 ForkJoinPool 的 Compensate 看并发框架的线程补偿思想
java·后端·源码阅读
格砸7 小时前
从入门到辞职|从ChatGPT到OpenClaw,跟上智能时代的进化
前端·人工智能·后端
蝎子莱莱爱打怪8 小时前
GitLab CI/CD + Docker Registry + K8s 部署完整实战指南
后端·docker·kubernetes
哈密瓜的眉毛美8 小时前
零基础学Java|第三篇:DOS 命令、转义字符、注释与代码规范
后端
用户60572374873089 小时前
AI 编码助手的规范驱动开发 - OpenSpec 初探
前端·后端·程序员