【Java SE】JVM字符串常量池：位置、创建流程、对象个数与 `intern()`

JVM字符串常量池：位置、创建流程、对象个数与 intern

字符串常量池是什么？解决的是什么问题？
[常量池的位置：JDK 6/7/8+ 的常见理解](#常量池的位置：JDK 6/7/8+ 的常见理解)
先搞懂两种"创建字符串"的差别
- 字面量：直接走常量池复用
- [new String("abc")：堆上再来一份](#new String("abc")：堆上再来一份)
常见写法到底创建几个字符串对象？
- 同样字面量多次出现
- [new String("123") 出现多次](#new String("123") 出现多次)
- [new String("a" + "b")](#new String("a" + "b"))
- ["a" + "b"](#"a" + "b")
- [str1 + str2：运行期拼接，默认不会进常量池](#str1 + str2：运行期拼接，默认不会进常量池)
- [new String("ab") + "ab";](#new String("ab") + "ab";)
- [new String("ab") + new String("ab")](#new String("ab") + new String("ab"))
- [new String("ab") + new String("cd");](#new String("ab") + new String("cd");)
intern()：让"等值字符串"指向池里的那一个
参考

在 Java 里，String 无处不在：JSON、SQL、日志、配置......字符串创建频繁，如果每次都分配新对象，会带来明显的内存与 GC 压力。于是 JVM/类加载体系为 字符串字面量 提供了一个"复用池"------字符串常量池（String Intern Pool）。

字符串常量池是什么？解决的是什么问题？

可以把字符串常量池理解为：对"可复用字符串"的缓存表。

当 class 文件里出现字符串字面量（例如 "abc"），JVM 在加载/运行过程中会确保池里有一份对应的字符串对象；
后续再次用到同样字面量时，直接复用池中的那一个引用，避免重复分配。

它能成立有一个关键前提：String 不可变 。一旦某个 "abc" 被多个地方复用，也不会出现"你改了我也跟着变"的数据竞争问题。

常量池的位置：JDK 6/7/8+ 的常见理解

很多资料会把"方法区/永久代/元空间/堆"混在一起说。这里给一个更实用的记忆方式（以 HotSpot 为主）：

JDK 6：字符串常量池常被认为在"永久代"（方法区的一种实现）里
JDK 7 起 ：字符串常量池迁移到堆（更便于 GC、避免永久代容易 OOM）
JDK 8 起 ：永久代移除，类元数据转到元空间（本地内存）；但字符串常量池仍在堆这一点延续

结论：现代 Java（JDK 8/11/17/21...）里，基本可以按"字符串常量池在堆上"来理解 。参考原文也按这个脉络展开。https://www.cnblogs.com/Andya/p/14067618.html

先搞懂两种"创建字符串"的差别

字面量：直接走常量池复用

java 复制代码

String a = "abc";
String b = "abc";
System.out.println(a == b); // true（同一份池对象）

因为 "abc" 是字面量，a 和 b 指向同一个池中对象。

new String("abc")：堆上再来一份

java 复制代码

String a = "abc";
String b = new String("abc");
System.out.println(a == b); // false
System.out.println(a.equals(b)); // true

这里至少涉及两层含义：

"abc" 这个字面量：在池里（如果之前没有则放进去）
new String("abc")：堆上再 new 一个新对象 ，内容来自池中的 "abc"

常见写法到底创建几个字符串对象？

同样字面量多次出现

java 复制代码

String s1 = "123";
String s2 = "123";
String s3 = "123";

池里：1 个（"123"）
堆上：0个（没有 new String / 运行期拼接）

new String("123") 出现多次

java 复制代码

String s4 = new String("123");
String s5 = new String("123");

池里：1 个（"123"）
堆上：2个（new String("123")+ new String("123")）

new String("a" + "b")

java 复制代码

String s6 = new String("a" + "b");

new String("a" + "b") 在编译期 会把 "a" + "b" 常量折叠 成 "ab"，等价于：new String("ab")

池里：1 个（"ab"）
堆上：1 个（new String("ab")）

"a" + "b"

java 复制代码

String s7 = "a" + "b";

"a" + "b" 是编译期常量表达式 ，会被常量折叠为 "ab"，等价于new String("ab")

池：1 个（"ab"）
堆：0 个（没有 new String / 运行期拼接）

str1 + str2：运行期拼接，默认不会进常量池

java 复制代码

String s8= "ab";
String s9 = "cd";
String s10 = s8 + s9;

池：2 个（"ab"、"cd"）
堆：1 个（运行期拼接结果 str3，内容为 "abcd"，默认不进池）

【补充】：运行期拼接过程中还会在堆上临时创建 1 个 StringBuilder 对象 （以及其内部数组等），但它不属于"字符串常量池"。它会在 toString() 时创建新的结果 String 对象 （例如 "abcd"）。

new String("ab") + "ab";

java 复制代码

String s11 = new String("ab") + "ab";

池：1 个（"ab"）
堆：2 个（new String("ab") 1 个 + 运行期拼接结果 "abab" 1 个）

new String("ab") + new String("ab")

池：1 个（"ab"）
堆：3 个（两个 new String("ab") + 运行期拼接结果 "abab"）

new String("ab") + new String("cd");

池：2 个（"ab"、"cd"）
堆：3 个（new String("ab") + new String("cd") + 运行期拼接结果 "abcd"）

intern()：让"等值字符串"指向池里的那一个

java 复制代码

String x = new String("123"); // 堆对象
String y = x.intern();        // 返回池中对应对象的引用
System.out.println(y == "123"); // true

理解一句话就够了：intern() 返回"常量池中等内容字符串"的引用；如果池里没有，可能把当前字符串（或其等价表示）放进去，再返回池引用。

参考

原文：https://www.cnblogs.com/Andya/p/14067618.html