并发集合是为了解决多线程环境中数据结构安全访问而设计的。在传统的集合如 ArrayList 或 HashMap 等中,当多个线程尝试并发地修改同一个集合时,往往会遇到并发修改异常(ConcurrentModificationException)或者遇到不一致的状态,因为这些集合不是线程安全的。
Java中的并发集合
Java的 java.util.concurrent 包提供了一系列的并发集合,它们能够在多线程环境下安全地执行插入、移除和访问操作。这些集合包括:
ConcurrentHashMapCopyOnWriteArrayListCopyOnWriteArraySetConcurrentLinkedQueueConcurrentLinkedDequeBlockingQueue的不同实现,如ArrayBlockingQueue、LinkedBlockingQueue、PriorityBlockingQueue等BlockingDeque的实现,如LinkedBlockingDequeConcurrentSkipListMap和ConcurrentSkipListSet
工作原理
1. 分段锁(Segmentation)
ConcurrentHashMap 在Java 7及以前的版本中使用分段锁的概念。集合被分成一系列的段(segment),每个段其实就是一个小的哈希表,并且每个段都有它自己的锁。当一个线程访问一个段时,它只需要获取对应段的锁,而不会影响到其他段。这种方式减少了锁的竞争,使得多个线程可以同时访问不同段的数据。
从Java 8开始,ConcurrentHashMap 使用了一种不同的锁机制来进一步优化性能,具体来说是使用了一种称为CAS(Compare-And-Swap)的技术来减少锁的使用。
2. CAS(Compare-And-Swap)
CAS操作是一种无锁的原子操作,它包含三个操作数------内存位置、预期原值以及新值。CAS操作仅在内存位置的当前值与预期原值相匹配时,才会将内存位置的值更新为新值。这保证了该操作的原子性。AtomicInteger 是 Java 中使用 CAS 的一个例子。
在 ConcurrentHashMap 中,这种技术被用来实现非阻塞的算法,使得多线程可以在没有锁的情况下安全地执行复杂的更新操作。
3. 写时复制(Copy-On-Write)
CopyOnWriteArrayList 和 CopyOnWriteArraySet 使用了写时复制策略。当集合被修改时,内部结构(如数组)会被整体复制,在副本上进行更改,然后再将原始结构指向新的副本。这种机制确保了在遍历集合时不会抛出 ConcurrentModificationException,因为遍历操作只会访问到原始数据,即使在遍历时有其他线程对集合进行了修改。
写时复制是一种读优化策略,适用于读多写少的并发场景。它的缺点是写操作的成本较高,因为每次修改都需要复制整个底层数组。
4. 阻塞和非阻塞的队列
BlockingQueue 和 BlockingDeque 接口提供了阻塞的插入和移除操作。如果队列为空,取操作会阻塞直到有元素可取;如果队列满了,插入操作会阻塞直到队列有空间。这些集合通常用于生产者-消费者模式。
ConcurrentLinkedQueue 和 ConcurrentLinkedDeque 是基于链接节点的线程安全队列,它们使用非阻塞算法,通常通过CAS操作来保证线程安全。
5. 跳表
ConcurrentSkipListMap 和 ConcurrentSkipListSet 是基于跳表数据结构的并发集合。跳表是一个有序的数据结构,通常通过多层链表来实现,能够提供与平衡树相当的并发性能,但是实现起来更为简单。跳表允许并发地进行查找、插入和删除操作,其性能通常是对数级别的。
使用场景
这些并发集合的使用依赖于具体的应用场景。如果需要大量的并行读取和少量的更新操作,CopyOnWriteArrayList 可能是最佳选择。而需要高并发插入和删除操作时,ConcurrentLinkedQueue 或 ConcurrentLinkedDeque 可能更适合。ConcurrentHashMap 则适用于需要高并发访问和更新的键值对集合。
总之,并发集合通过使用分段锁、CAS、写时复制等高级并发控制技术,提供了在多线程环境中安全且高效的数据操作方式。开发者应当根据具体的并发需求,选择最合适的集合类型来使用。