美团面试拷打:ConcurrentHashMap 为何不能插入 null?HashMap 为何可以?
-
周末的时候,有一位小伙伴提了一些关于
ConcurrentHashMap
的问题,都是他最近面试遇到的。原提问如下: -
整个提问看着非常复杂,其实归纳来说就是两个问题:
-
ConcurrentHashMap
为什么 key 和 value 不能为 null? -
ConcurrentHashMap
能保证复合操作的原子性吗? -
下面我会以此提供这两个问题的详细答案,希望对你有帮助。
ConcurrentHashMap 为什么 key 和 value 不能为 null?
-
ConcurrentHashMap
的 key 和 value 不能为 null 主要是为了避免二义性。null 是一个特殊的值,表示没有对象或没有引用。如果你用 null 作为键,那么你就无法区分这个键是否存在于ConcurrentHashMap
中,还是根本没有这个键。同样,如果你用 null 作为值,那么你就无法区分这个值是否是真正存储在ConcurrentHashMap
中的,还是因为找不到对应的键而返回的 -
拿 get 方法取值来说,返回的结果为 null 存在两种情况:
-
值没有在集合中 ;
-
值本身就是 null。
-
这也就是二义性的由来。
-
多线程环境下,存在一个线程操作该
ConcurrentHashMap
时,其他的线程将该ConcurrentHashMap
修改的情况,所以无法通过containsKey(key)
来判断否存在这个键值对,也就没办法解决二义性问题了。 -
与此形成对比的是,
HashMap
可以存储 null 的 key 和 value,但 null 作为键只能有一个,null 作为值可以有多个。如果传入 null 作为参数,就会返回 hash 值为 0 的位置的值。单线程环境下,不存在一个线程操作该 HashMap 时,其他的线程将该HashMap
修改的情况,所以可以通过contains(key)
来做判断是否存在这个键值对,从而做相应的处理,也就不存在二义性问题。 -
也就是说,多线程下无法正确判定键值对是否存在(存在其他线程修改的情况),单线程是可以的(不存在其他线程修改的情况)。
-
如果你确实需要在 ConcurrentHashMap 中使用 null 的话,可以使用一个特殊的静态空对象来代替 null。
public static final Object NULL = new Object();
-
最后,再分享一下
ConcurrentHashMap
作者本人 (Doug Lea)对于这个问题的回答:
The main reason that nulls aren't allowed in ConcurrentMaps (ConcurrentHashMaps, ConcurrentSkipListMaps) is that ambiguities that may be just barely tolerable in non-concurrent maps can't be accommodated. The main one is that if map.get(key) returns null, you can't detect whether the key explicitly maps to null vs the key isn't mapped. In a non-concurrent map, you can check this via map.contains(key), but in a concurrent one, the map might have changed between calls.
- 翻译过来之后的,大致意思还是单线程下可以容忍歧义,而多线程下无法容忍。
ConcurrentHashMap 能保证复合操作的原子性吗?
-
ConcurrentHashMap
是线程安全的,意味着它可以保证多个线程同时对它进行读写操作时,不会出现数据不一致的情况,也不会导致 JDK1.7 及之前版本的HashMap
多线程操作导致死循环问题。但是,这并不意味着它可以保证所有的复合操作都是原子性的,一定不要搞混了! -
复合操作是指由多个基本操作(如
put
、get
、remove
、containsKey
等)组成的操作,例如先判断某个键是否存在containsKey(key)
,然后根据结果进行插入或更新put(key, value)
。这种操作在执行过程中可能会被其他线程打断,导致结果不符合预期。 -
例如,有两个线程 A 和 B 同时对
ConcurrentHashMap
进行复合操作,如下:
// 线程 A
if (!map.containsKey(key)) {
map.put(key, value);
}
// 线程 B
if (!map.containsKey(key)) {
map.put(key, anotherValue);
}
-
如果线程 A 和 B 的执行顺序是这样:
- 线程 A 判断 map 中不存在 key
- 线程 B 判断 map 中不存在 key
- 线程 B 将 (key, anotherValue) 插入 map
- 线程 A 将 (key, value) 插入 map
-
那么最终的结果是 (key, value),而不是预期的 (key, anotherValue)。这就是复合操作的非原子性导致的问题。
那如何保证 ConcurrentHashMap
复合操作的原子性呢?
-
ConcurrentHashMap
提供了一些原子性的复合操作,如putIfAbsent
、compute
、computeIfAbsent
、computeIfPresent
、merge
等。这些方法都可以接受一个函数作为参数,根据给定的 key 和 value 来计算一个新的 value,并且将其更新到 map 中。 -
上面的代码可以改写为:
// 线程 A
map.putIfAbsent(key, value);
// 线程 B
map.putIfAbsent(key, anotherValue);
-
或者:
// 线程 A
map.computeIfAbsent(key, k -> value);
// 线程 B
map.computeIfAbsent(key, k -> anotherValue);
- 很多同学可能会说了,这种情况也能加锁同步呀!确实可以,但不建议使用加锁的同步机制,违背了使用
ConcurrentHashMap
的初衷。在使用ConcurrentHashMap
的时候,尽量使用这些原子性的复合操作方法来保证原子性。
-----------------------------------------------------------------------------------
offer突击训练营简介:
1:针对不知道怎么面试,面试没有信心的小伙伴,我们会给你一个offer保障。
2:我们会监督你15-20天内把面试体系技术点掌握至少7成,这样足够你去找到满意的工作了。
3:我们是面向面试学习指导,不会带你们去写代码,会把项目真实开发的迭代过程和技术细节如何实现业务功能都详细教清楚,你能在面试中流畅表达清楚就行了,项目经验你不用担心(技术老师提供的真实项目经验肯定拿的出手),自己学和别人带着系统学,效率完全不一样。
详情请点击这里 :offer突击训练营,给你一个offer的保障,求职跳槽的看过来!