Java集合相关的List、Set、Map基础知识

目录

一、集合介绍

二、List

三、Map

HashMap的数据结构

如何理解红黑树

四、set


一、集合介绍

在Java中,集合是一种用于存储对象的数据结构,它提供了一种更加灵活和强大的方式来处理和操作数据。++Java集合框架提供了一系列接口和类,用于表示和操作不同类型的集合++。

图片来源:《面渣逆袭手册》V1.1
其中 Collection 是集合 List 、 Set 的父接口,它主要有两个子接口:

List :存储的元素有序,可重复。(相当于是个篮子,临时给你放数据用的 )
Set :存储的元素无序,不可重复。(去重的List,放进去的东西如果一样,后面的会把前面的覆盖掉,得到的是个无重复值的列表 )
Map 是另外的接口,是键值对映射结构的集合。(Map是个键值对,可以实现用a来搜b的作用,比如用用户的id搜用户的名称之类的操作 )


以下是Java中常见的集合:

  1. List(列表)

    • ArrayList:基于数组实现的动态数组,支持快速随机访问元素,但插入和删除操作效率较低。
    • LinkedList:基于链表实现的双向列表,插入和删除操作效率较高,但访问元素的效率较低。
    • Vector:与 ArrayList 类似,但是线程安全的,不推荐在新代码中使用。
    • Stack:基于 Vector 实现的栈,通常用于实现后进先出(LIFO)的数据结构。
  2. Set(集合)

    • HashSet:基于哈希表实现的集合,不保证元素的顺序。
    • TreeSet:基于红黑树实现的有序集合,可以按照自然顺序或者自定义顺序对元素进行排序。
    • LinkedHashSet:具有预期插入顺序的集合,内部使用链表维护元素的顺序。
  3. Map(映射)

    • HashMap:基于哈希表实现的映射,键值对无序。
    • TreeMap:基于红黑树实现的有序映射,键值对按照键的自然顺序或者自定义顺序进行排序。
    • LinkedHashMap:具有预期插入顺序的映射,内部使用链表维护键值对的顺序。
  4. Queue(队列)

    • PriorityQueue:基于堆实现的优先级队列,按照元素的优先级顺序进行排序。

此外,Java集合框架还包括一些接口和抽象类,如 CollectionMapIterator 等,它们提供了一组通用的操作和方法,可以方便地对集合进行操作和遍历。

二、List

在 Java 中,ArrayListLinkedList 是两种常见的集合实现,它们有以下主要区别:

  1. 内存分配

    • ArrayList:使用连续的内存空间来存储元素。
    • LinkedList:使用链式存储结构,内存空间不连续,它们在空间占用上都有一些额外的消耗。
      • ArrayList 是预先定义好的数组,可能会有空的内存空间,存在一定空间浪费
        LinkedList 每个节点,需要存储前驱和后继,所以每个节点会占用更多的空间
  2. 随机访问

    • ArrayList:基于数组,所以它可以根据下标查找,支持快速的随机访问,通过索引可以快速获取元素。
    • LinkedList:基于链表,所以它没法根据序号直接获取元素,在随机访问方面效率较低。
  3. 插入和删除

    • 多数情况下,ArrayList更利于查找,LinkedList更利于增删。
      • ArrayList 基于数组实现, get(int index) 可以直接通过数组下标获取,时间复杂度
        是 O(1) ; LinkedList 基于链表实现, get(int index) 需要遍历链表,时间复杂度是
        O(n) ;当然, get(E element) 这种查找,两种集合都需要遍历,时间复杂度都是
        O(n) 。
      • ArrayList增删如果是数组末尾的位置,直接插入或者删除就可以了,但是如果插
        入中间的位置,就需要把插入位置后的元素都向前或者向后移动,甚至还有可能
        触发扩容;双向链表的插入和删除只需要改变前驱节点、后继节点和插入节点的
        指向就行了,不需要移动元素。
    • 图片来源:《面渣逆袭手册》V1.1
  4. 内存占用

    • ArrayList:需要预先分配一定的内存空间,如果元素数量超过容量,需要进行扩容。
      基于数组的集合,数组的容量是在定义的时候确定的,如果数组满了,
      再插入,就会数组溢出。所以在插入时候,会先检查是否需要扩容,如果当前容量
      +1 超过数组长度,就会进行扩容。
    • ArrayList的扩容是创建一个1.5倍的新数组,然后把原数组的值拷贝过去。
    • LinkedList:不需要预先分配固定的内存空间。
  5. 遍历方式

    • ArrayList:可以通过索引或迭代器进行遍历。
    • LinkedList:还可以通过指针依次访问元素。
      示例代码如下:
    java 复制代码
    import java.util.ArrayList;
    import java.util.LinkedList;
    import java.util.List;
    
    public class CollectionExample {
    
        public static void main(String[] args) {
    
            // 使用 ArrayList
            List<String> arrayList = new ArrayList<>();
            arrayList.add("Apple");
            arrayList.add("Banana");
            arrayList.add("Orange");
    
            System.out.println("使用 ArrayList 遍历:");
            for (String item : arrayList) {
                System.out.println(item);
            }
    
            // 使用 LinkedList
            List<String> linkedList = new LinkedList<>();
            linkedList.add("Apple");
            linkedList.add("Banana");
            linkedList.add("Orange");
    
            System.out.println("\n 使用 LinkedList 遍历:");
            for (String item : linkedList) {
                System.out.println(item);
            }
        }
    }

三、Map

在 Java 中,常见的 Map 实现有 HashMapTreeMap

HashMap 基于哈希表实现,它的数据结构如下:

  • 存储键值对。
  • 通过哈希函数计算键的哈希值,以确定元素在哈希表中的存储位置。

TreeMap 基于红黑树实现,它的数据结构如下:

  • 按照键的自然顺序进行排序。
  • 提供有序的键值对访问。

HashMap的数据结构

JDK1.8 的数据结构是 数组 + 链表 + 红黑树 。

数据结构示意图如下:

图片来源:《面渣逆袭手册》V1.1
其中,桶数组 是用来存储数据元素,链表是用来解决冲突, 红黑树 是为了提高查询
的效率。
数据元素通过映射关系,也就是散列函数,映射到桶数组对应索引的位置
如果发生冲突,从冲突的位置拉一个链表,插入冲突的元素
如果链表长度 > 8 & 数组大小 >= 64 ,链表转为红黑树
如果红黑树节点个数 < 6 ,转为链表

哈希表的基本原理是通过哈希函数将键映射到特定的存储位置,以实现快速的插入、查找和删除操作。


哈希函数用于计算键的哈希值,并根据哈希值确定元素在哈希表中的存储位置。哈希表通常包含以下组件:

  1. 数组:用于存储元素。
  2. 哈希函数:将键转换为数组的索引。
  3. 冲突处理机制:处理不同键可能映射到相同索引的冲突。

在插入元素时,通过哈希函数计算键的哈希值,确定存储位置。如果该位置为空,则直接插入元素;如果存在冲突,使用冲突处理机制解决。

在查找元素时,同样通过哈希函数计算哈希值,找到对应的位置进行查找。

哈希表的优点包括:

  1. 快速的插入、查找和删除操作。
  2. 不需要按照特定顺序存储元素。

如何理解红黑树

红黑树本质上是一种二叉查找树,为了保持平衡,它又在二叉查找树的基础上增加了一些规则:

  1. 颜色规则:每个节点要么是红色,要么是黑色
  2. 特性规则:
    • 根节点是黑色的。
    • 如果一个节点是红色的,那么它的子节点必须是黑色的。
    • 从每个叶子节点到根节点的所有路径上,黑色节点的数量相同。
      在进行插入或删除操作时,红黑树会通过一系列的旋转和颜色调整来保持这些规则,以确保树的平衡性。

图片来源:《面渣逆袭手册》V1.1

旋转操作包括左旋和右旋,用于调整树的结构。

红黑树有两种方式保持平衡: 旋转 和 染色 。通过保持红黑树的平衡性,可以提高搜索、插入和删除操作的效率,避免出现最坏情况下的线性搜索。

有关HashMap的知识点非常多,这里不做详述,后面会单独写一篇有关HashMap的相关内容。

哈希表在以下场景中比较适用:

  1. 快速查找:当需要快速查找数据时,哈希表可以提供高效的查找性能。
  2. 存储和检索数据:适用于需要频繁地插入、删除和查找数据的场景。
  3. 缓存:可以用于缓存数据,以提高系统的性能。
  4. 统计频率:用于统计元素的出现频率。
  5. 数据去重:去除重复的数据。
  6. 关联数据:建立键值对的关联。
    例如,在以下场景中可能会使用哈希表:
  7. 数据库索引:加速数据的查询。
  8. 缓存系统:提高数据的访问速度。
  9. 网页搜索引擎:快速检索和索引网页。
  10. 数据处理和分析:高效地处理大量数据。

四、set

HashSet 是 Java 中的一个集合类,它不允许存储重复的元素。HashSet 底层就是基于 HashMap 实现的。( HashSet 的源码⾮常⾮常少,因为除了 clone() 、 writeObject() 、 readObject() 是 HashSet⾃⼰不得不实现之外,其他⽅法都是直接调⽤ HashMap 中的⽅法。

HashSet的add方法,直接调用HashMap的put方法,将添加的元素作为key,new一个 Object作为value,直接调用HashMap的put方法,它会根据返回值是否为空来判断是否插入元素成功。

以下是 HashSet 的一些特点:

  1. 无序性:元素的存储顺序是无序的。
  2. 不允许重复元素:确保每个元素在集合中唯一。
  3. 基于哈希表实现:提供快速的插入、查找和删除操作。

参考

《面渣逆袭手册》V1.1.pdf

相关推荐
confiself10 分钟前
大模型系列——LLAMA-O1 复刻代码解读
java·开发语言
Wlq041515 分钟前
J2EE平台
java·java-ee
XiaoLeisj21 分钟前
【JavaEE初阶 — 多线程】Thread类的方法&线程生命周期
java·开发语言·java-ee
豪宇刘36 分钟前
SpringBoot+Shiro权限管理
java·spring boot·spring
Elaine20239140 分钟前
02多线程基础知识
java·多线程
gorgor在码农43 分钟前
Redis 热key总结
java·redis·热key
~yY…s<#>1 小时前
【刷题17】最小栈、栈的压入弹出、逆波兰表达式
c语言·数据结构·c++·算法·leetcode
百事老饼干1 小时前
Java[面试题]-真实面试
java·开发语言·面试
customer081 小时前
【开源免费】基于SpringBoot+Vue.JS医院管理系统(JAVA毕业设计)
java·vue.js·spring boot·后端·spring cloud·开源·intellij-idea