ArrayList源码实现(一)

ArrayList源码实现(一)

1. ArrayList的大小是如何自动增加的?

  • 初始化
    • 在构造函数中,可以设定列表的初始值大小,如果没有的话默认使用,提供的静态数据
jsx 复制代码
 public ArrayList(int initialCapacity) {
        if (initialCapacity > 0) {
            this.elementData = new Object[initialCapacity];
        } else if (initialCapacity == 0) {
            this.elementData = EMPTY_ELEMENTDATA;
        } else {
            throw new IllegalArgumentException("Illegal Capacity: "+
                                               initialCapacity);
        }
    }

注意:elementData 变量是 transient 关键字修饰的。

  • 动态扩容

重点关注 ensureCapacityInternal 函数,



实际的扩容函数

总结:在每次添加add 新的数据时,会进行一次 数组长度大小 的判断;

  1. 如果是数组为 空 时,最小长度就是 10,否则的话,带扩容的最小长度时 size(此时保存了多少数据)+1 (*calculateCapacity*
  2. 当最小容量 大于 数组的总长度时,进行扩容(ensureExplicitCapacity
  3. 数组的最大长度就是 Integer.*MAX_VALUE*
  4. 注意:扩容是创建了一个新的数组,将 elementData 指向了新的数组(elementData = Arrays.*copyOf*(elementData, newCapacity);

2. ArrayList的增加或者删除某个对象的对象为什么效率很低?

在ArraysList中 add、addAll与remove等方法,底层主要依赖于 System.*arraycopy ,这个是一个*native 方法,在ArrayList 对外提供的方法中,大量的使用了这个API,当频繁的对列表中的元素进行 add/remove 操作是,会比较费资源。

附录

1. transient 是什么

transient 关键字在 Java 中的作用是指定某个类的成员变量不参与序列化过程。序列化是将对象的状态转换为字节流的过程,常用于将对象保存到文件中或通过网络传输。而使用 transient 关键字修饰的变量在对象被序列化时不会被保存,这样可以防止不必要或敏感的数据被序列化。

具体作用如下:

  1. 防止序列化敏感数据 :某些类的字段可能包含敏感数据(如密码、个人信息),你不希望它们被序列化并保存到磁盘或通过网络传输。在这种情况下,可以使用 transient 关键字修饰该字段,序列化时就会跳过这个字段。
  2. 节省存储空间 :对于某些不需要序列化的字段(例如缓存、临时变量等),使用 transient 可以避免不必要的数据占用存储空间。
  3. 防止不合法的数据 :某些字段可能在对象被反序列化之后重新计算或初始化,如果这些字段被序列化了,可能会导致不合法的状态。在这种情况下,也可以使用 transient 来避免这些字段的序列化。

2. list中定义的最大长度为什么会减8

/**

* The maximum size of array to allocate.

* Some VMs reserve some header words in an array.

* Attempts to allocate larger arrays may result in

* OutOfMemoryError: Requested array size exceeds VM limit

*/

private static final int MAX_ARRAY_SIZE = Integer.MAX_VALUE - 8;

MAX_ARRAY_SIZE = Integer.MAX_VALUE - 8 的设置是为了处理 JVM 中数组分配的一些特定限制和内存管理问题。Integer.MAX_VALUE2^31 - 1,即 2147483647,是 Java 中 int 类型的最大值。但在实际中,JVM 为数组分配内存时,最大数组大小会比这个理论值略小。以下是为什么减去 8 的原因:

原因分析:

  1. JVM 的内存管理和数组头部
    • 在 JVM 中,数组对象除了存储数组的数据本身外,还需要存储一些额外的信息,比如数组的长度、类型信息等。这些信息占用了一部分内存,通常被称为数组的头部(header words)。
    • 具体需要多少字节来存储这些头部信息,依赖于 JVM 实现和对象内存布局。虽然不同 JVM 实现可能有所不同,但大多数 JVM 可能会保留几个字节(如 8 字节)用于这部分元数据。
  2. 避免 OutOfMemoryError
    • 通过减去 8,确保在数组分配时有足够的空间容纳这些头部信息,避免超出 JVM 对数组对象大小的限制。如果不进行这个调整,分配接近 Integer.MAX_VALUE 大小的数组可能会导致 OutOfMemoryError,因为 JVM 不能同时为数据和头部信息分配足够的内存。
    • 这个限制还可以避免一些边界情况下的问题,比如内存碎片或者其他 JVM 的内部管理机制的需求。
  3. 系统和实现的差异
    • 不同的 JVM 和平台可能有不同的数组大小限制。尽管理论上 Java 数组可以拥有 Integer.MAX_VALUE 个元素(即 2147483647 个),但在实际中,JVM 往往需要一些额外的空间来管理数组的结构。因此,MAX_ARRAY_SIZE 设置为 Integer.MAX_VALUE - 8 是一个安全边界,可以确保数组不会因为接近最大值而触发异常。

总结:

MAX_ARRAY_SIZE = Integer.MAX_VALUE - 8 是为了确保在 JVM 中分配接近最大容量的数组时,不会因为数组头部信息或 JVM 内存管理的限制而导致 OutOfMemoryError。减去的 8 字节主要是预留给数组的头部信息或其他内存管理开销。

3. System.arraycopy 方法

System.arraycopy(a, 0, elementData, size, numNew) 是 Java 中用于执行数组复制的代码,使用了 System.arraycopy 方法。这个方法能够快速、高效地复制数组中的元素。让我们详细解释这个调用的作用:

参数解析:

java 复制代码
System.arraycopy(a, 0, elementData, size, numNew);
  1. a:源数组,表示要从中复制元素的数组。
  2. 0 :源数组 a 中复制的起始位置,表示从 a 数组的第一个元素(索引 0)开始复制。
  3. elementData:目标数组,表示将元素复制到的数组。
  4. size :目标数组 elementData 中开始粘贴元素的位置,表示将从目标数组的 size 索引开始粘贴数据。
  5. numNew :要复制的元素数量,表示从源数组 a 中复制多少个元素到目标数组。
相关推荐
漫漫进阶路5 小时前
VS C++ 配置OPENCV环境
开发语言·c++·opencv
陈平安Java and C5 小时前
MyBatisPlus
java
秋野酱5 小时前
如何在 Spring Boot 中实现自定义属性
java·数据库·spring boot
安的列斯凯奇6 小时前
SpringBoot篇 单元测试 理论篇
spring boot·后端·单元测试
Bunny02126 小时前
SpringMVC笔记
java·redis·笔记
架构文摘JGWZ6 小时前
FastJson很快,有什么用?
后端·学习
BinaryBardC6 小时前
Swift语言的网络编程
开发语言·后端·golang
feng_blog66886 小时前
【docker-1】快速入门docker
java·docker·eureka
code_shenbing6 小时前
基于 WPF 平台使用纯 C# 制作流体动画
开发语言·c#·wpf
邓熙榆6 小时前
Haskell语言的正则表达式
开发语言·后端·golang