Map接口和Collection接口是所有集合框架的父接口:
- Collection接口的子接口包括:Set接口和List接口
- Map接口的实现类主要有:HashMap、TreeMap、Hashtable、ConcurrentHashMap以及Properties等
- Set接口的实现类主要有:HashSet、TreeSet、LinkedHashSet等
- List接口的实现类主要有:ArrayList、LinkedList、Stack以及Vector等

List接口及其实现
ArrayList
-
基于动态数组实现
-
允许快速随机访问元素
-
插入和删除操作可能需要移动其他元素,因此在中间位置插入和删除的时间复杂度为O(n)
-
非同步,不是线程安全的,可以使用使用
Collections.synchronizedList(new ArrayList<>())
创建一个同步的ArrayList
。
LinkedList
-
基于双向链表实现
-
允许快速插入删除元素
-
不能快速随机访问,访问元素的时间复杂度为O(n)
-
非同步,不是线程安全的。可以使用
Collections.synchronizedList(new LinkedList<>())
创建一个同步的LinkedList
。 -
可以用做队列或双向队列
依赖于两个节点(一个头节点一个尾节点)
常用方法
添加
add(E e) :在链表后添加一个元素; 通用方法 addFirst(E e) :在链表头部插入一个元素; 特有方法 addLast(E e):在链表尾部添加一个元素; 特有方法
删除
removeFirst(E e) :删除头,获取元素并删除; 特有方法 removeLast(E e):删除尾; 特有方法
查看
getFirst() :获取第一个元素; 特有方法 getLast():获取最后一个元素; 特有方法
Stack
-
基于
Vector
实现,代表了后进先出() -
是同步的,是线程安全的
-
push
入栈、peek
查看栈顶元素、pop
出栈、empty
是否为空、size
()获取数目
Vector
-
基于动态数组实现,类似于
ArrayList
-
同步的,是线程安全的
-
是需要线程安全的动态数组是使用,但是通常使用
ArrayList
和Collections.syschronizedList
来代替
Set接口及其实现类
set其实一直在用map那一套
public class HashSet<E> extends AbstractSet<E> implements Set<E>, Cloneable, java.io.Serializable {
private transient HashMap<E,Object> map;
private static final Object PRESENT = new Object();
public HashSet() {
map = new HashMap<>();
}
public boolean add(E e) {
return map.put(e, PRESENT) == null;
}
// Other methods delegate to the underlying map
}
HashSet
-
元素存储
HashSet
将元素添加到底层的HashMap
中,键是元素的哈希码,值是一个占位符对象。HashSet
的实现是基于HashMap
的,他使用HashMap来存储元素,在HashSet中,元素被当作HashMap的键,而HashMap的值则是一个固定的占位符,通常是PRESENT
对象(一个静态内部类对象)。这样做是为了节省空间,因为HashSet
只关心元素的唯一性,不需要存储额外的值。 -
去重 :
HashSet
使用了HashMap
键的唯一性来确保HashSet
中不会有重复的元素。 -
不保证集合的迭代顺序,顺序可能会随时间变化。
-
方法委派 :
HashSet
的许多方法(如add
、remove
、contains
等)都是通过调用底层HashMap
的对应方法来实现的。 -
性能 :由于
HashSet
是基于HashMap
实现的,所以其性能与HashMap
类似,添加、删除和查找操作的平均时间复杂度为 O(1)。 -
允许存储
null
值。
LinkedHashSet
LinkedHashSet
是 HashSet
的一个子类,它继承了 HashSet
的特性,并且保持了元素的插入顺序。下面是关于 LinkedHashSet
的一些关键点:
-
继承自HashSet并且使用链表维护元素的插入顺序
-
保证迭代顺序与插入顺序一致
-
允许存储
null
值。 -
插入、删除、和查找操作的时间复杂度为O(1)。
实现细节
-
当你向
LinkedHashSet
添加元素时,它会使用LinkedHashMap
来存储元素。 -
每个元素被当作
LinkedHashMap
的键,值则是一个固定的占位符对象。 -
LinkedHashSet
通过委派LinkedHashMap
来实现其add
、remove
和contains
等方法。
TreeSet
TreeSet
是 Java 中实现 SortedSet
接口的一个集合类,它基于 TreeMap
实现,并且元素是按照自然顺序(或通过提供的比较器)排序的。以下是 TreeSet
的一些关键点:
-
基于红黑树(自平衡二叉搜索树)实现
-
元素是有序的,元素按照自然顺序(或通过
Comparator
指定的顺序)排 -
不允许存储
null
值(会抛出NullPointerException
) -
插入、删除、和查找操作的时间复杂度为O(log n)。
Map接口及其实现类
HashMap:

-
基于哈希表实现,调用put方法值,首先将k,v封装到Node对象中,然后底层会调用k的hashCode()方法得到hash值。根据这个值来决定到底该插入数组下标的哪个位置,如果有两个值的哈希值一样,就会调用equals方法进行比较,如果哈希值一样但是不相等,就会形成链表插入 ,如果相等那么相等的这个节点的value将会被覆盖。如果没有元素占用位置,就直接放入即可。(通过数组加链表形式)
-
在Java8对hashmap进行了优化,如果相同哈希值,链表的长度超过8,就从链表转换成红黑树。第一次添加元素的时候,默认初期长度为16,当往map中继续添加元素的时候,通过hash值跟数组长度取"与"来决定放在数组的哪个位置,如果出现放在同一个位置的时候,优先以链表的形式存放,在同一个位置的个数又达到了8个(代码是>=7,从0开始,及第8个开始判断是否转化成红黑树),如果数组的长度还小于64的时候,则会扩容数组。如果数组的长度大于等于64的话,才会将该节点的链表转换成树。在扩容完成之后,如果某个节点的是树,同时现在该节点的个数又小于等于6个了,则会将该树转为链表(只有当数据量大于64才会有红黑树+链表)
-
HashMap内部结构是数组(Node[] table)和链表结合组成的复合结构,数组被分成一个个桶(bucket)或槽,通过哈希值决定键值对在这个数组的寻址;哈希值相同的键值对,则以链表形式存储。当链表大小超过阈值(TREEIFY_THRESHOLD = 8)时,链表就会被改造成树形结构。(查询效率变高)
-
Java8不再像Java7中那样需要满足两个条件,Java8中扩容只需要满足一个条件:当前存放新值(注意不是替换已有元素位置时)的时候已有元素的个数大于等于阈值(已有元素等于阈值,下一个存放后必然触发扩容机制)且扩容发生在存放后,即是数据存放后(先存放后扩容),判断当前存入对象的个数,如果大于阈值则进行扩容。
-
允许存储
null
键和null
值。 -
插入、删除、和查找操作的时间复杂度为O(1)。
-
非同步,不是线程安全的。
LinkedHashMap

-
通过hashmap跟双向链表实现,可以确保按照插入顺序迭代链表
-
遍历性能: 与普通的
HashMap
相比,在迭代LinkedHashMap
时,性能更加稳定。因为它不需要遍历整个桶,而是按照链表顺序遍历元素。 -
实现方式: 在内部实现上,
LinkedHashMap
在每个条目中保留了前一个和后一个条目的引用,以实现双向链表。这使得在插入、删除和遍历元素时的性能表现良好。
TreeMap:

-
基于红黑树实现
-
键按照自然顺序(或通过
Comparator
指定的顺序)排序。 -
不允许存储Null键
-
插入、删除、和查找操作的时间复杂度为O(log n)。
Hashtable
-
也是使用哈希表还有链表实现
-
同步的,是线程安全的。
-
不允许存储
null
键和null
值。 -
插入、删除、和查找操作的时间复杂度为O(1)。
Properties
-
继承自
Hashtable
,表示一个持久化的属性集。 -
每个键及其对应值都是一个字符串。
-
常用于读取和写入配置文件。
ConcurrentHashMap
-
不允许存储
null
键和null
值。 -
插入、删除、和查找操作的时间复杂度为O(1)。
-
在多线程环境下,使用HashMap进行put操作时存在丢失数据的情况,为了避免这种bug的隐患,强烈建议使用ConcurrentHashMap代替HashMap。
-
HashTable是一个线程安全的类,它使用synchronized来锁住整张Hash表来实现线程安全,即每次锁住整张表让线程独占,相当于所有线程进行读写时都去竞争一把锁,导致效率非常低下。ConcurrentHashMap可以做到读取数据不加锁,并且其内部的结构可以让其在进行写操作的时候能够将锁的粒度保持地尽量地小,允许多个修改操作并发进行,其关键在于使用了锁分段技术。它使用了多个锁来控制对hash表的不同部分进行的修改。
分段锁(Segment Locking)机制
早期版本的ConcurrentHashMap
(Java 7及之前)使用分段锁机制,具体如下:
-
ConcurrentHashMap
内部将整个哈希表分为多个段(Segment
),每个段都是一个独立的哈希表,并拥有自己的锁。 -
这种机制允许多个线程同时访问不同段的元素,从而提高并发度。
-
ConcurrentHashMap 为了提高本身的并发能力,在内部采用了一个叫做 Segment 的结构,一个 Segment 其实就是一个类 Hash Table 的结构,Segment 内部维护了一个链表数组,我们用下面这一幅图来看下 ConcurrentHashMap 的内部结构,从下面的结构我们可以了解到,ConcurrentHashMap 定位一个元素的过程需要进行两次Hash操作,第一次 Hash 定位到 Segment,第二次 Hash 定位到元素所在的链表的头部,因此,这一种结构的带来的副作用是 Hash 的过程要比普通的 HashMap 要长,但是带来的好处是写操作的时候可以只对元素所在的 Segment 进行操作即可,不会影响到其他的 Segment,这样,在最理想的情况下,ConcurrentHashMap 可以最高同时支持 Segment 数量大小的写操作(刚好这些写操作都非常平均地分布在所有的 Segment上),所以,通过这一种结构,ConcurrentHashMap 的并发能力可以大大的提高。

CAS操作和分段锁
在Java 8中,ConcurrentHashMap
使用了一种新的机制,结合了CAS(Compare-And-Swap)操作和细粒度的分段锁。
-
使用CAS操作来保证对单个节点的原子性操作,减少锁的使用。
-
在插入、删除和更新操作中,如果CAS操作失败(即另一个线程同时修改了相同的位置),则退而使用锁进行操作。
-
在Java 8中,
ConcurrentHashMap
取消了分段锁的概念,直接在哈希桶(bucket)级别进行锁定,使用CAS操作和synchronized
块来保证并发安全。这使得数据结构更加简单,且操作更加直观。 -
为了优化哈希冲突情况下的查找性能,Java 8引入了红黑树。当链表的长度超过一定阈值(默认是8)时,链表会转换为红黑树。这样,在高冲突情况下,查找操作的时间复杂度从O(n)降到了O(log n),极大地提高了性能。
-
CAS 操作通过比较当前值与预期值,如果两者相等则更新为新值,否则重试该操作。
数据结构
ConcurrentHashMap
在Java 8中的内部数据结构有以下几个关键组成部分:
-
数组(Node<K,V>[] table):哈希表的核心数组,存储链表或红黑树的头节点。
-
链表和红黑树:数组中的每个桶(bucket)最初是一个链表。当链表长度超过阈值(8)时,链表会转换为红黑树,以提高查询效率。