Java 中 Integer 对象的缓存机制与包装类特性

在 Java 后端开发中，基本数据类型与其对应的包装类是非常基础且频繁使用的部分。为了提升程序的运行效率并减少对系统资源的消耗，Java 在 java.lang.Integer 类中设计了一个整数缓存池（Integer Cache）。

基本数据类型与包装类的关系

Java 是一门面向对象的编程语言，但为了保证基本的运算性能，Java 保留了 8 种基本数据类型（如 int、long、double 等）。基本数据类型直接存储在栈内存中，仅仅保存数值本身，没有对象头，不能调用任何方法。

但在很多场景下，我们需要将数值作为对象来处理 。例如，Java 的集合框架（如 List、Map）只能存放对象引用，无法直接存放基本数据类型；泛型机制也只支持对象类型（特别注意 int\[\] 也是对象）。因此，Java 为每一种基本数据类型提供了一个对应的包装类。int 对应的包装类就是 Integer。

在 Java 5 之前，基本数据类型和包装类之间的转换需要手动编写代码。从 Java 5 开始，编译器引入了自动装箱（Autoboxing） 和 自动拆箱（Unboxing） 功能。

自动装箱 ：将基本数据类型自动转换为包装类对象。例如 Integer a = 10;。
自动拆箱 ：将包装类对象自动转换为基本数据类型。例如 int b = a;。

虽然编译器简化了代码的编写，但这种转换在底层依然涉及对象实例的创建和方法的调用。如果不加以控制，频繁的装箱操作会产生大量的对象实例，进而引发性能问题。

Integer 缓存机制的范围与触发条件

为了减少小数值整数在自动装箱时造成的对象创建开销，Integer 类内部维护了一个对象缓存池。

默认缓存范围

在默认情况下，Integer 会缓存数值在 -128 到 127（包含 -128 和 127）之间的对象实例。

触发条件

并不是所有的 Integer 对象都会放入或使用缓存池。只有通过以下两种方式获取 Integer 对象时，缓存机制才会生效：

自动装箱 ：例如直接赋值 Integer num = 100;。
静态工厂方法 ：显式调用 Integer.valueOf(int i) 方法。例如 Integer num = Integer.valueOf(100);。

当请求的数值在 -128 到 127 之间时，上述两种操作不会在堆内存中创建新的对象，而是直接从缓存池中返回预先创建好的同一个对象实例。

如果请求的数值超出了这个范围（例如 128 或者是 -129），每次执行装箱操作或者调用 valueOf 方法时，系统都会通过 new Integer(...) 在堆内存中分配一个新的对象。

此外，如果在代码中显式使用 new Integer(100) 这种构造函数的方式来创建对象，则会直接绕过缓存机制，无论数值是多少，都会创建一个全新的对象。

缓存机制的源码实现原理

要了解这个机制的具体运行方式，可以查看 Java 标准库中 Integer 类的源代码。在 Integer 类的内部，有一个私有的静态内部类 IntegerCache。

java 复制代码

private static class IntegerCache {
    static final int low = -128;
    static final int high;
    static final Integer cache[];

    static {
        // high value may be configured by property
        int h = 127;
        String integerCacheHighPropValue =
            sun.misc.VM.getSavedProperty("java.lang.Integer.IntegerCache.high");
        if (integerCacheHighPropValue != null) {
            try {
                int i = parseInt(integerCacheHighPropValue);
                i = Math.max(i, 127);
                // Maximum array size is Integer.MAX_VALUE
                h = Math.min(i, Integer.MAX_VALUE - (-low) -1);
            } catch( NumberFormatException nfe) {
                // If the property cannot be parsed into an int, ignore it.
            }
        }
        high = h;

        cache = new Integer[(high - low) + 1];
        int j = low;
        for(int k = 0; k < cache.length; k++)
            cache[k] = new Integer(j++);

        // range[-128, 127] must be interned (JLS7 5.1.7)
        assert IntegerCache.high >= 127;
    }

    private IntegerCache() {}
}

从上述源码中可以看出：

IntegerCache 使用一个静态数组 cache 来保存对象引用。
缓存的下限 low 是被 final 关键字固定的常量，值为 -128。
缓存的上限 high 默认值是 127，但它会在类加载阶段去读取系统的属性配置。
在静态代码块中，执行了一个 for 循环，从 -128 开始，逐个实例化 Integer 对象，并填充到 cache 数组中。

由于这是静态代码块，因此在 Java 虚拟机（JVM）首次加载 Integer 类时，这个缓存数组就会被初始化完毕。这属于一种空间换时间的策略，即在启动时预先分配少量的内存，避免在程序运行期间频繁进行分配操作。

与之配合的是 valueOf 方法的逻辑：

java 复制代码

public static Integer valueOf(int i) {
    if (i >= IntegerCache.low && i <= IntegerCache.high)
        return IntegerCache.cache[i + (-IntegerCache.low)];
    return new Integer(i);
}

当程序调用 Integer.valueOf(i) 时，方法内部首先判断参数 i 是否在 low 和 high 的区间内。如果在区间内，就通过偏移量计算出该数值在数组中的索引位置（即 i + 128），并直接返回该位置的数组元素；如果不在区间内，则执行 new Integer(i)。

修改缓存区间的上限

在很多业务系统中，数值 128 到 1000 之间的整数使用频率可能同样非常高。默认的 127 上限可能无法满足减少对象分配的需求。

Java 允许通过修改虚拟机启动参数来扩大 Integer 缓存的上限值。可以使用以下两种参数之一来设置：

-XX:AutoBoxCacheMax=1000
-Djava.lang.Integer.IntegerCache.high=1000

在启动 Java 进程时加入该参数后，前文提到的静态代码块会读取到这个配置，并将 high 变量设置为 1000。此时，-128 到 1000 范围内的数值在装箱时都会复用同一对象。

需要注意的是：

只能修改上限，不能修改下限 。底层源码中 low 是硬编码的 -128。
修改的值不能低于 127 。Java 语言规范（JLS）明确规定了 -128 到 127 必须被缓存，如果设置的参数小于 127，源码内部会通过 Math.max(i, 127) 将其强制忽略并维持在 127。
不要设置过大的缓存上限 。如果将上限设置为 1000000，JVM 在启动时就会立刻在堆内存中创建一百万个 Integer 对象并保存在一个巨大的静态数组中，这会白白占用几十 MB 的常驻内存，反而违背了优化性能的初衷。

缓存机制在业务开发中的影响与错误场景

由于缓存机制的存在，在编写 Java 代码时如果不清楚对象引用与数值比较的区别，极易产生逻辑判断错误。

误用 == 运算符比较包装类

在 Java 中，== 运算符用于基本数据类型时，比较的是数值大小；而用于引用数据类型（对象）时，比较的是两个变量是否指向内存中的同一个对象地址。

由于 Integer 是对象，使用 == 会导致比较其内存地址，这就与缓存池产生了直接关联。

java 复制代码

public class IntegerCompare {
    public static void main(String[] args) {
        Integer a = 100;
        Integer b = 100;
        System.out.println(a == b); // 输出 true

        Integer c = 200;
        Integer d = 200;
        System.out.println(c == d); // 输出 false

        Integer e = new Integer(100);
        Integer f = new Integer(100);
        System.out.println(e == f); // 输出 false
    }
}

在上面的代码中：

变量 a 和 b 被赋值为 100。因为 100 在 -128 到 127 的范围内，所以 valueOf 方法从缓存数组中返回了同一个对象的引用。它们指向同一块内存地址，因此 a == b 为 true。
变量 c 和 d 被赋值为 200。200 超出了默认的缓存范围，所以两次装箱操作分别执行了 new Integer(200)。堆内存中生成了两个不同的对象实体，它们的内存地址不同，因此 c == d 为 false。
变量 e 和 f 是通过 new 关键字显式创建的。这种做法绕过了缓存，必定生成不同的对象，因此结果也是 false。

实际业务场景中的问题

在实际业务开发中，这种错误经常出现在状态码或类型的判断分支中。例如，一个订单实体类中包含一个包装类型的状态字段：

java 复制代码

public void processOrder(Order order) {
    Integer status = order.getStatus();
    
    // 假设测试环境下，状态码都是 1 或 2，测试人员发现逻辑正常
    if (status == 1) {        
        // 处理待支付逻辑
    } else if (status == 200) { 
        // 假设 200 是退款状态，这个分支永远不会被正确执行
        // 处理退款逻辑
    }
}

当 order.getStatus() 返回的对象数值为 200 时，它与字面量常量 200 进行 == 比较。此时字面量 200 会被自动装箱为一个新的 Integer(200) 对象，两个不同的对象比较结果永远为 false，导致这段退款逻辑分支永远无法被执行，从而产生线上故障。

正确的比较方式

为了避免缓存机制带来的地址比较不一致问题，所有包装类对象之间的数值比较，或者包装类对象与基本数据类型的比较，都必须采用基于数值的比较方法。

方式一：使用 equals() 方法
Integer 类重写了 Object 类的 equals 方法，其内部逻辑会先判断类型，然后拆箱比对内部存储的实际整数值。

java 复制代码

if (status != null && status.equals(200)) {
    // 处理逻辑
}

方式二：手动拆箱后使用 == 比较

调用 intValue() 方法将其转换为基本数据类型 int，此时 == 运算符就会进行数值大小的比较。

java 复制代码

if (status != null && status.intValue() == 200) {
    // 处理逻辑
}

需要特别注意的是 ，无论采用哪种方式，都必须先进行 null 判断。包装类的一个特点是可以赋值为 null，如果直接对 null 对象调用 equals 或者进行拆箱操作，会直接抛出空指针异常（NullPointerException）。

对象内存占用与 GC 压力分析

为了彻底理解为什么要设计这个缓存，我们需要看一看内存的消耗。这涉及到 Java 对象的内存布局。

在 64 位的 JVM 且开启指针压缩（默认行为）的环境下，一个基本数据类型 int 只需要占用 4 个字节 的内存。

但是，一个 Integer 对象在堆内存中占用的空间远不止 4 个字节，它包含以下几个部分：

对象头（Mark Word）：占用 8 个字节，用于存储对象的哈希码、锁状态、垃圾回收分代年龄等信息。
类指针（Klass Pointer）：开启指针压缩后占用 4 个字节，指向该对象所属的类元数据。
实例数据（Instance Data） ：即对象内部封装的那个 int 类型的值，占用 4 个字节。
对齐填充（Padding）：由于 JVM 要求对象占据的内存空间必须是 8 字节的整数倍。前三项加起来是 8 + 4 + 4 = 16 字节，刚好是 8 的倍数，不需要额外的填充。

由此可见，存储一个整数，使用 int 只需要 4 字节，而使用 Integer 对象则需要 16 字节。对象的内存占用是基本数据类型的 4 倍。

对垃圾回收（GC）的影响

在大型系统中，数据的流转和计算往往非常密集。假设有一个批处理任务，通过循环解析文本数据，生成了一百万个代表年龄或百分比的数字（大多在 0 到 100 之间），并放入 List<Integer> 中。

如果不使用缓存机制，每一次 Integer.valueOf(i) 都会创建一个 16 字节的对象。一百万个数字将占据大约 15.2 MB 的堆内存。而且这些通常都是临时使用的局部对象。

在 Java 垃圾回收机制中，新创建的对象会被分配在堆内存的年轻代（Young Generation）的 Eden 区中。当 Eden 区满了之后，就会触发 Minor GC。系统需要暂停当前运行的用户线程（Stop-The-World），扫描并清理这些临时对象。

如果在高并发场景下，大量线程都在无缓存的情况下频繁创建重复范围内的 Integer 对象，会导致 Eden 区迅速被填满，Minor GC 被频繁触发。频繁的垃圾回收会大量消耗 CPU 资源，导致应用程序对外提供服务的吞吐量下降，接口响应延迟增加。

Integer 缓存机制的作用就是拦截这些高频发生的小数值对象创建请求。因为 0 到 100 这个范围的数值在多数业务系统中出现频率极高，通过直接返回 IntegerCache 数组中预先占好位置的对象，程序运行期间完全不需要在堆内存中新分配这一百万个 16 字节的空间，这从源头上削减了年轻代的内存分配速率，大幅度降低了 GC 发生的频率。

JVM 的进一步优化：逃逸分析与标量替换

随着 JVM 技术的发展，在局部代码段中即使不走缓存（例如超出了 127，或者开发者强制调用了 new Integer()），虚拟机也可能不会真正在堆上创建对象。

现代的 HotSpot 虚拟机在即时编译（JIT）阶段，会执行一种名为 逃逸分析（Escape Analysis） 的优化。虚拟机会分析一个对象的作用域：如果这个 Integer 对象是在方法内部被创建的，并且作为临时变量使用完后，没有被作为返回值传递出去，也没有被赋值给外部类的成员变量，那么这个对象就没有发生"逃逸"。

对于没有逃逸的包装类对象，JVM 可能会实施 标量替换（Scalar Replacement） 。既然只是为了包装一个 int 数值，且对象没有逃逸，JVM 会取消对象头的创建，直接将这个 4 字节的基本类型 int 值分配在当前线程的 虚拟机栈（Stack） 上。

随着方法的执行结束，栈帧出栈，这 4 个字节的局部变量会被直接销毁。由于没有在堆上分配对象，所以完全不需要垃圾回收器的介入。这是 JVM 在底层对避免包装类开销所做的另一项重要技术兜底。

其他包装类的缓存情况

不仅是 Integer 类，Java 为其他的几种基本数据类型的包装类也提供了类似的缓存机制，但规则有所不同。

包含缓存机制的包装类

Byte ：由于 byte 类型本身占用的内存极小，它的取值范围固定 在 -128 到 127 之间。因此 Byte 包装类内部的静态数组大小固定为 256，所有可能的数值对象都被提前缓存。只要使用 Byte.valueOf(b)，必定返回缓存对象。
Short ：规则与 Integer 类似，缓存池默认范围是 -128 到 127 。但与 Integer 不同的是，Short 并没有对外提供类似 -XX:AutoBoxCacheMax 的虚拟机参数来修改缓存上限，范围是写死在源码里的。
Long ：规则等同于 Short，缓存了 -128 到 127 的对象，且无法通过配置调整范围。
Character ：char 表示字符，不能为负数。Character 类缓存了从 0 到 127 的字符对象。这个范围正好覆盖了基础的 ASCII 字符集（包括所有标准的英文字母、数字和常见标点符号），超出意义不大。
Boolean ：由于 boolean 类型只有两个可能的值，Boolean 包装类不需要创建数组。它在内部直接定义了两个静态常量实例 Boolean.TRUE 和 Boolean.FALSE。所有的装箱操作或者调用 Boolean.valueOf(b) 仅仅是在这两个单例对象之间做选择。

包装类	缓存范围	是否可修改范围
Byte	-128 ~ 127	不可修改
Short	-128 ~ 127	不可修改
Integer	-128 ~ 127（默认）	可以（通过 `-XX:AutoBoxCacheMax=xxx` 或系统属性）
Long	-128 ~ 127	不可修改
Character	0 ~ 127	不可修改
Boolean	仅两个单例	不涉及范围

注意：

所有有缓存的包装类（Byte、Short、Integer、Long、Character、Boolean）使用 new XXX(value) 构造函数都会绕过缓存，创建全新的对象 （其中 new Boolean(true/false) 也不例外，会创建独立于 Boolean.TRUE 和 Boolean.FALSE 的新实例。不过已被废弃（deprecated），不推荐使用）。
只有 Integer 的缓存范围可以配置 ，是因为 int / Integer 是 Java 中最常用 的整数类型（计数、索引、状态码等小整数极其频繁），扩大缓存能显著提升性能并减少对象创建与 GC 压力；而 Byte（仅 256 个值）、Short、Long、Character 的值域要么太小、要么使用频率较低，固定缓存范围就足够，没有必要提供可调参数。

不包含缓存机制的包装类

Float
Double

浮点数包装类没有任何缓存机制。这是由于浮点数的数学性质决定的。即使是在一个非常小的范围，例如 0 到 1 之间，也存在着无穷多个小数（例如 0.1，0.01，0.001 等等）。这使得预先创建对象并放入数组在逻辑上是行不通的。对于浮点数，不管是通过自动装箱还是调用 valueOf 方法，每次操作都会在堆中创建一个新的对象引用。因此，对于 Float 和 Double 包装类，使用 == 永远比较不出正确的数值一致性，必须使用 equals，或者调用其内部的静态比较方法如 Double.compare(d1, d2)。

总结与开发建议

理解了包装类的缓存机制与内存结构后，我们在日常的后端开发中可以确立以下几个明确的代码规范：

数值比较原则 ：永远不要使用 == 或 != 来对比两个包装类对象，或者对比包装类对象与其他任何对象。无论逻辑上的数值是否在缓存范围内，使用 equals() 判断对象内容才是唯一稳妥的做法。
防范空指针异常 ：在进行包装类向基本类型的自动拆箱（例如参与算术运算，或者赋值给基本数据类型变量）前，必须进行 null 值检查。在使用 equals 方法时，应确保调用方对象不为 null。
按需调整缓存 ：如果经过监控和压测分析发现，程序中大量创建了特定范围（例如超过 127，但在 1000 以内）的 Integer 对象，导致了明显的垃圾回收停顿，可以考虑在启动脚本中增加 -XX:AutoBoxCacheMax 参数来缓解 GC 压力。
性能敏感场景的替代方案 ：如果在处理海量数据的科学计算、大批量的数据分析场景下，对象的空间开销和拆装箱的性能损耗依然不可接受。应该尽量使用基本数据类型的数组（如 int）。