Java 中的 Map、Set 和 List 集合在底层实现中都可能涉及扩容机制,具体实现方式因集合类型而异。以下是它们各自的扩容机制详解:
一、List 扩容机制
List 是单列集合,常见的实现类包括 ArrayList 和 LinkedList。其中 ArrayList 基于动态数组实现,因此存在扩容机制。
ArrayList 扩容机制:
-
触发条件:当添加元素时,如果当前元素数量(size)等于底层数组长度(elementData.length),就会触发扩容。
-
扩容策略:
- 初始容量为 10(无参构造时)。
- 扩容公式为:
newCapacity = oldCapacity + (oldCapacity >> 1),即原容量的 1.5 倍。 - 如果扩容后的容量仍小于所需容量,则直接使用所需容量。
- 当容量接近虚拟机数组大小限制(
MAX_ARRAY_SIZE)时,会进行特殊处理以避免溢出。
-
性能优化:
- 批量添加(如
addAll)时,会预先计算总需求容量,避免多次中间扩容,从而提升性能。
- 批量添加(如
二、Set 扩容机制
Set 是单列集合,常见的实现类有 HashSet 和 TreeSet。其中 HashSet 底层基于 HashMap 实现,因此其扩容机制与 HashMap 相似。
HashSet 扩容机制:
- 触发条件:当元素个数超过容量 * 加载因子(默认为 0.75)时触发扩容。
- 扩容策略 :
- 初始容量为 16。
- 每次扩容为原来的 2 倍。
- 加载因子为 0.75,意味着当元素数量达到容量的 75% 时进行扩容。
三、Map 扩容机制
Map 是双列集合,常见的实现类包括 HashMap、TreeMap 和 Hashtable。其中 HashMap 是最常用的实现类,其扩容机制较为复杂。
HashMap 扩容机制:
- 触发条件:当元素数量超过阈值(threshold = capacity * loadFactor)时触发扩容。
- 扩容策略 :
- 默认初始容量为 16,且长度始终为 2 的幂次方。
- 加载因子为 0.75。
- 扩容时容量变为原来的 2 倍。
- 在 JDK 1.8 后,链表长度大于等于 8 时转为红黑树以提升查找效率。
- 扩容时需要重新计算每个元素的哈希索引,并将旧桶中的元素迁移至新桶中。
总结
| 集合类型 | 底层结构 | 扩容机制 |
|---|---|---|
| List | 数组 | 1.5 倍扩容,初始容量为 10 |
| Set | HashMap(HashSet) | 容量翻倍,加载因子 0.75 |
| Map | 数组 + 链表/红黑树(HashMap) | 容量翻倍,加载因子 0.75 |
这些机制在保证数据结构灵活性的同时,也兼顾了性能与内存使用效率。
怎样设置初始容量,提高效率
在 Java 中,合理设置集合的初始容量可以有效减少扩容操作,从而提高程序运行效率。以下是针对不同集合类型设置初始容量的方法和建议:
1. ArrayList
ArrayList 的初始容量默认为 10,若能预估元素数量,应提前设置合适的初始容量,避免频繁扩容。
// 不推荐:默认容量,可能频繁扩容
List<String> list = new ArrayList<>();
// 推荐:预设初始容量
List<String> list = new ArrayList<>(100);
2. HashSet
HashSet 的底层实现是 HashMap,其初始容量默认为 16,加载因子为 0.75。如果知道元素数量,可以设置合适的初始容量以减少扩容次数。
// 不推荐:默认容量
Set<String> set = new HashSet<>();
// 推荐:根据元素数量设置初始容量
Set<String> set = new HashSet<>(x/0.75+1);
3. HashMap
HashMap 的初始容量默认为 16,加载因子为 0.75。若预知元素数量,可设置初始容量以避免扩容操作。
// 不推荐:默认容量
Map<String, Integer> map = new HashMap<>();
// 推荐:根据预期元素数量设置初始容量
Map<String, Integer> map = new HashMap<>(x/0.75+1);
4. LinkedList
LinkedList 是基于双向链表实现的,不涉及容量问题,因此无需设置初始容量。
5. TreeSet
TreeSet 基于 TreeMap 实现,其初始容量与 TreeMap 相同,可通过构造函数传入初始容量。
// 推荐:根据元素数量设置初始容量
Set<String> set = new TreeSet<>(new HashSet<>(x/0.75+1));
总结
通过预估集合元素数量并设置合适的初始容量,可以有效减少扩容带来的性能损耗,提升程序运行效率。