专家视角看Java线程生命周期与上下文切换的本质

Java线程生命周期与上下文切换的本质

前言

本文旨在记录近期研读Java源码的学习心得与疑难问题。由于个人理解水平有限,文中内容难免存在疏漏,恳请读者不吝指正。

Java线程生命周期与上下文切换的本质

在 OpenJDK 8u44 的架构中,从一行简单的 Java 代码到 Linux 内核的任务调度,是一场跨越了四个世界的"接力赛":Java 虚拟机(JVM)本地运行库(C-Runtime/Pthreads)系统调用接口(System Call Interface) 以及 Linux 内核(Kernel)

下面我们以 Thread.start() 为例,深度解构这条完整的转换链路。


第一阶段:Java 世界的逻辑封包

这一切始于 java.lang.Thread 类的堆内存分配。

  • Java 源码jdk/src/share/classes/java/lang/Thread.java
  • 动作new Thread() 仅仅是在 JVM 堆中创建了一个普通对象,并初始化了 prioritydaemon 等属性。真正的转换发生在执行 start() 方法时。
  • 关键点start() 内部调用了 native void start0()。这是 JVM 预留的"虫洞",通过 JNI 指向了 C++ 实现。

第二阶段:JVM 世界的资源编排

控制权通过 JNI 进入了 HotSpot 的 C++ 环境。

1. JNI 映射与准入
  • 源码hotspot/src/share/vm/prims/jvm.cpp
  • 入口JVM_StartThread
  • 职责 :JVM 检查 eetop(End-to-End Thread Object Pointer)是否已存在,确保一个 Java 线程不会被启动两次。
2. C++ JavaThread 对象的诞生
  • 操作 :执行 new JavaThread(&thread_entry, sz)
  • 原理 :这会调用重写过的 operator new,在 Native Heap 而非 Java Heap 分配内存。此时,JVM 并没有直接呼叫内核,而是先在用户态构建好一个"管理实体"。

第三阶段:操作系统适配层 (OS Abstraction Layer)

JVM 需要跨越到系统平台相关的代码,将"逻辑线程"转化为"物理线程"。

1. 调用 os::create_thread
  • 源码hotspot/src/os/linux/vm/os_linux.cpp
  • 动作
    1. 分配 OSThread 对象,用于记录 Linux 特有的属性(如 TID)。
    2. 设置线程栈大小。如果是 Java 线程,它会根据 -XssThreadStackSize 来计算字节数。
2. 握手 Pthreads
  • 核心调用 :执行 pthread_create(&tid, &attr, (void* (*)(void*)) java_start, thread)
  • 专家视点 :此时 JVM 调用的是 Linux 上的标准线程库(Glibc)。java_start 是 JVM 传入的回调函数,它就像是一个"驻内核办事处",负责在新线程启动后立即接管控制权。

第四阶段:从用户态到内核态的"致命一跃"

这是最底层的转换:pthread_create 并不是终点,它只是一个包装器。

1. 触发 clone() 系统调用

在 Linux 中,线程被视为轻量级进程(LWP)pthread_create 最终会触发 clone 系统调用(System Call #56)。

转换维度 用户态 (User Space) 内核态 (Kernel Space)
执行流 线程(Thread) 任务(Task / LWP)
内存结构 JavaThread C++ 对象 task_struct 结构体
标识符 Java 线程 ID PID (内核视角下的进程 ID)
栈控制 JVM 管理的 1MB 虚拟空间 内核管理的 thread_info 和内核栈
2. 进入内核:do_forkcopy_process

内核接收到 clone 请求后:

  1. 分配 PID:为新线程分配一个唯一的进程标识符。
  2. 写时复制(COW):因为是线程,内核会让新任务共享父进程的地址空间、文件描述符和信号处理。
  3. 调度器入队 :新创建的 task_struct 被放入 CPU 的运行队列(Runqueue)。

第五阶段:反向激活(Callback & Stub)

一旦内核调度器决定运行这个新任务,CPU 会跳转到之前注册的 java_start 地址。

  1. 物理就绪java_start 被触发,新线程在 Linux 层面正式存活。
  2. 同步屏障 :子线程在 os_linux.cpp 中通过 futex 等待父线程完成 eetop 的绑定。
  3. 汇编跳板 :执行 JavaCalls::call_virtual -> call_stub
  4. 业务运行 :通过一段动态生成的汇编机器码,CPU 从 C++ 的 call_stub 彻底"跳入" Java 字节码的 run() 方法。

总结:完整转换链路清单

Java 层 (Thread.start)
→ \rightarrow → JNI 层 (JVM_StartThread)
→ \rightarrow → JVM 层 (JavaThread & OSThread)
→ \rightarrow → C 库层 (pthread_create)
→ \rightarrow → 系统调用层 (clone)
→ \rightarrow → 内核层 (task_struct & 调度器)
→ \rightarrow → 反向回调 (java_start)
→ \rightarrow → 汇编跳板 (call_stub)
→ \rightarrow → 代码运行 (run)

相关推荐
HHHHH1010HHHHH2 小时前
如何在 WordPress 中通过邮箱获取用户 ID
jvm·数据库·python
云深麋鹿2 小时前
C++ | 容器list
开发语言·c++·容器·list
2301_782659182 小时前
C#怎么使用LINQ Contains包含判断 C#如何用Contains实现类似SQL IN查询的集合包含判断【语法】
jvm·数据库·python
程序猿乐锅2 小时前
Java第十三篇:Stream流
java·笔记
2301_773553622 小时前
如何优化深分页场景下的回表代价_延迟关联与主键游标分页
jvm·数据库·python
林三的日常2 小时前
SpringBoot + Druid SQL Parser 解析表名、字段名(纯Java,最佳方案)
java·spring boot·sql
deviant-ART2 小时前
java stream 的 findFirst 和 findAny 踩坑点
java·开发语言·后端
weixin_568996062 小时前
Golang怎么实现跳表数据结构_Golang如何用Skip List实现有序数据的快速查找【方法】
jvm·数据库·python
青衫码上行2 小时前
【从零开始学习JVM】字符串常量池
java·jvm·学习·面试·string