ArrayList源码实现(一)

ArrayList源码实现(一)

1. ArrayList的大小是如何自动增加的?

  • 初始化
    • 在构造函数中,可以设定列表的初始值大小,如果没有的话默认使用,提供的静态数据
jsx 复制代码
 public ArrayList(int initialCapacity) {
        if (initialCapacity > 0) {
            this.elementData = new Object[initialCapacity];
        } else if (initialCapacity == 0) {
            this.elementData = EMPTY_ELEMENTDATA;
        } else {
            throw new IllegalArgumentException("Illegal Capacity: "+
                                               initialCapacity);
        }
    }

注意:elementData 变量是 transient 关键字修饰的。

  • 动态扩容

重点关注 ensureCapacityInternal 函数,



实际的扩容函数

总结:在每次添加add 新的数据时,会进行一次 数组长度大小 的判断;

  1. 如果是数组为 空 时,最小长度就是 10,否则的话,带扩容的最小长度时 size(此时保存了多少数据)+1 (*calculateCapacity*
  2. 当最小容量 大于 数组的总长度时,进行扩容(ensureExplicitCapacity
  3. 数组的最大长度就是 Integer.*MAX_VALUE*
  4. 注意:扩容是创建了一个新的数组,将 elementData 指向了新的数组(elementData = Arrays.*copyOf*(elementData, newCapacity);

2. ArrayList的增加或者删除某个对象的对象为什么效率很低?

在ArraysList中 add、addAll与remove等方法,底层主要依赖于 System.*arraycopy ,这个是一个*native 方法,在ArrayList 对外提供的方法中,大量的使用了这个API,当频繁的对列表中的元素进行 add/remove 操作是,会比较费资源。

附录

1. transient 是什么

transient 关键字在 Java 中的作用是指定某个类的成员变量不参与序列化过程。序列化是将对象的状态转换为字节流的过程,常用于将对象保存到文件中或通过网络传输。而使用 transient 关键字修饰的变量在对象被序列化时不会被保存,这样可以防止不必要或敏感的数据被序列化。

具体作用如下:

  1. 防止序列化敏感数据 :某些类的字段可能包含敏感数据(如密码、个人信息),你不希望它们被序列化并保存到磁盘或通过网络传输。在这种情况下,可以使用 transient 关键字修饰该字段,序列化时就会跳过这个字段。
  2. 节省存储空间 :对于某些不需要序列化的字段(例如缓存、临时变量等),使用 transient 可以避免不必要的数据占用存储空间。
  3. 防止不合法的数据 :某些字段可能在对象被反序列化之后重新计算或初始化,如果这些字段被序列化了,可能会导致不合法的状态。在这种情况下,也可以使用 transient 来避免这些字段的序列化。

2. list中定义的最大长度为什么会减8

/**

* The maximum size of array to allocate.

* Some VMs reserve some header words in an array.

* Attempts to allocate larger arrays may result in

* OutOfMemoryError: Requested array size exceeds VM limit

*/

private static final int MAX_ARRAY_SIZE = Integer.MAX_VALUE - 8;

MAX_ARRAY_SIZE = Integer.MAX_VALUE - 8 的设置是为了处理 JVM 中数组分配的一些特定限制和内存管理问题。Integer.MAX_VALUE2^31 - 1,即 2147483647,是 Java 中 int 类型的最大值。但在实际中,JVM 为数组分配内存时,最大数组大小会比这个理论值略小。以下是为什么减去 8 的原因:

原因分析:

  1. JVM 的内存管理和数组头部
    • 在 JVM 中,数组对象除了存储数组的数据本身外,还需要存储一些额外的信息,比如数组的长度、类型信息等。这些信息占用了一部分内存,通常被称为数组的头部(header words)。
    • 具体需要多少字节来存储这些头部信息,依赖于 JVM 实现和对象内存布局。虽然不同 JVM 实现可能有所不同,但大多数 JVM 可能会保留几个字节(如 8 字节)用于这部分元数据。
  2. 避免 OutOfMemoryError
    • 通过减去 8,确保在数组分配时有足够的空间容纳这些头部信息,避免超出 JVM 对数组对象大小的限制。如果不进行这个调整,分配接近 Integer.MAX_VALUE 大小的数组可能会导致 OutOfMemoryError,因为 JVM 不能同时为数据和头部信息分配足够的内存。
    • 这个限制还可以避免一些边界情况下的问题,比如内存碎片或者其他 JVM 的内部管理机制的需求。
  3. 系统和实现的差异
    • 不同的 JVM 和平台可能有不同的数组大小限制。尽管理论上 Java 数组可以拥有 Integer.MAX_VALUE 个元素(即 2147483647 个),但在实际中,JVM 往往需要一些额外的空间来管理数组的结构。因此,MAX_ARRAY_SIZE 设置为 Integer.MAX_VALUE - 8 是一个安全边界,可以确保数组不会因为接近最大值而触发异常。

总结:

MAX_ARRAY_SIZE = Integer.MAX_VALUE - 8 是为了确保在 JVM 中分配接近最大容量的数组时,不会因为数组头部信息或 JVM 内存管理的限制而导致 OutOfMemoryError。减去的 8 字节主要是预留给数组的头部信息或其他内存管理开销。

3. System.arraycopy 方法

System.arraycopy(a, 0, elementData, size, numNew) 是 Java 中用于执行数组复制的代码,使用了 System.arraycopy 方法。这个方法能够快速、高效地复制数组中的元素。让我们详细解释这个调用的作用:

参数解析:

java 复制代码
System.arraycopy(a, 0, elementData, size, numNew);
  1. a:源数组,表示要从中复制元素的数组。
  2. 0 :源数组 a 中复制的起始位置,表示从 a 数组的第一个元素(索引 0)开始复制。
  3. elementData:目标数组,表示将元素复制到的数组。
  4. size :目标数组 elementData 中开始粘贴元素的位置,表示将从目标数组的 size 索引开始粘贴数据。
  5. numNew :要复制的元素数量,表示从源数组 a 中复制多少个元素到目标数组。
相关推荐
所待.383几秒前
JavaEE之线程初阶(上)
java·java-ee
Winston Wood4 分钟前
Java线程池详解
java·线程池·多线程·性能
Alive~o.06 分钟前
Go语言进阶&依赖管理
开发语言·后端·golang
花海少爷8 分钟前
第十章 JavaScript的应用课后习题
开发语言·javascript·ecmascript
手握风云-9 分钟前
数据结构(Java版)第二期:包装类和泛型
java·开发语言·数据结构
许苑向上12 分钟前
Dubbo集成SpringBoot实现远程服务调用
spring boot·后端·dubbo
喵叔哟29 分钟前
重构代码中引入外部方法和引入本地扩展的区别
java·开发语言·重构
尘浮生35 分钟前
Java项目实战II基于微信小程序的电影院买票选座系统(开发文档+数据库+源码)
java·开发语言·数据库·微信小程序·小程序·maven·intellij-idea
hopetomorrow1 小时前
学习路之PHP--使用GROUP BY 发生错误 SELECT list is not in GROUP BY clause .......... 解决
开发语言·学习·php
郑祎亦1 小时前
Spring Boot 项目 myblog 整理
spring boot·后端·java-ee·maven·mybatis