专家视角看Java线程生命周期与上下文切换的本质

Java线程生命周期与上下文切换的本质

前言

本文旨在记录近期研读Java源码的学习心得与疑难问题。由于个人理解水平有限,文中内容难免存在疏漏,恳请读者不吝指正。

Java线程生命周期与上下文切换的本质

在 OpenJDK 8u44 的架构中,从一行简单的 Java 代码到 Linux 内核的任务调度,是一场跨越了四个世界的"接力赛":Java 虚拟机(JVM)本地运行库(C-Runtime/Pthreads)系统调用接口(System Call Interface) 以及 Linux 内核(Kernel)

下面我们以 Thread.start() 为例,深度解构这条完整的转换链路。


第一阶段:Java 世界的逻辑封包

这一切始于 java.lang.Thread 类的堆内存分配。

  • Java 源码jdk/src/share/classes/java/lang/Thread.java
  • 动作new Thread() 仅仅是在 JVM 堆中创建了一个普通对象,并初始化了 prioritydaemon 等属性。真正的转换发生在执行 start() 方法时。
  • 关键点start() 内部调用了 native void start0()。这是 JVM 预留的"虫洞",通过 JNI 指向了 C++ 实现。

第二阶段:JVM 世界的资源编排

控制权通过 JNI 进入了 HotSpot 的 C++ 环境。

1. JNI 映射与准入
  • 源码hotspot/src/share/vm/prims/jvm.cpp
  • 入口JVM_StartThread
  • 职责 :JVM 检查 eetop(End-to-End Thread Object Pointer)是否已存在,确保一个 Java 线程不会被启动两次。
2. C++ JavaThread 对象的诞生
  • 操作 :执行 new JavaThread(&thread_entry, sz)
  • 原理 :这会调用重写过的 operator new,在 Native Heap 而非 Java Heap 分配内存。此时,JVM 并没有直接呼叫内核,而是先在用户态构建好一个"管理实体"。

第三阶段:操作系统适配层 (OS Abstraction Layer)

JVM 需要跨越到系统平台相关的代码,将"逻辑线程"转化为"物理线程"。

1. 调用 os::create_thread
  • 源码hotspot/src/os/linux/vm/os_linux.cpp
  • 动作
    1. 分配 OSThread 对象,用于记录 Linux 特有的属性(如 TID)。
    2. 设置线程栈大小。如果是 Java 线程,它会根据 -XssThreadStackSize 来计算字节数。
2. 握手 Pthreads
  • 核心调用 :执行 pthread_create(&tid, &attr, (void* (*)(void*)) java_start, thread)
  • 专家视点 :此时 JVM 调用的是 Linux 上的标准线程库(Glibc)。java_start 是 JVM 传入的回调函数,它就像是一个"驻内核办事处",负责在新线程启动后立即接管控制权。

第四阶段:从用户态到内核态的"致命一跃"

这是最底层的转换:pthread_create 并不是终点,它只是一个包装器。

1. 触发 clone() 系统调用

在 Linux 中,线程被视为轻量级进程(LWP)pthread_create 最终会触发 clone 系统调用(System Call #56)。

转换维度 用户态 (User Space) 内核态 (Kernel Space)
执行流 线程(Thread) 任务(Task / LWP)
内存结构 JavaThread C++ 对象 task_struct 结构体
标识符 Java 线程 ID PID (内核视角下的进程 ID)
栈控制 JVM 管理的 1MB 虚拟空间 内核管理的 thread_info 和内核栈
2. 进入内核:do_forkcopy_process

内核接收到 clone 请求后:

  1. 分配 PID:为新线程分配一个唯一的进程标识符。
  2. 写时复制(COW):因为是线程,内核会让新任务共享父进程的地址空间、文件描述符和信号处理。
  3. 调度器入队 :新创建的 task_struct 被放入 CPU 的运行队列(Runqueue)。

第五阶段:反向激活(Callback & Stub)

一旦内核调度器决定运行这个新任务,CPU 会跳转到之前注册的 java_start 地址。

  1. 物理就绪java_start 被触发,新线程在 Linux 层面正式存活。
  2. 同步屏障 :子线程在 os_linux.cpp 中通过 futex 等待父线程完成 eetop 的绑定。
  3. 汇编跳板 :执行 JavaCalls::call_virtual -> call_stub
  4. 业务运行 :通过一段动态生成的汇编机器码,CPU 从 C++ 的 call_stub 彻底"跳入" Java 字节码的 run() 方法。

总结:完整转换链路清单

Java 层 (Thread.start)
→ \rightarrow → JNI 层 (JVM_StartThread)
→ \rightarrow → JVM 层 (JavaThread & OSThread)
→ \rightarrow → C 库层 (pthread_create)
→ \rightarrow → 系统调用层 (clone)
→ \rightarrow → 内核层 (task_struct & 调度器)
→ \rightarrow → 反向回调 (java_start)
→ \rightarrow → 汇编跳板 (call_stub)
→ \rightarrow → 代码运行 (run)

相关推荐
m0_591364732 分钟前
Python如何进行数据平滑处理_使用Pandas滚动中位数计算
jvm·数据库·python
雨落在了我的手上7 分钟前
初识java(二):数据类型与变量
java·开发语言
小闫BI设源码7 分钟前
当20个节点选出两个Master时:Elasticsearch的致命故障与解决方案
java·elasticsearch·jenkins·php·面试宝典·深入解析
彳亍1019 分钟前
mysql主从复制和双主复制有什么区别_mysql架构对比
jvm·数据库·python
a7963lin9 分钟前
MySQL数据库提示表损坏怎么修复_使用REPAIR TABLE修复方案
jvm·数据库·python
2301_8152795210 分钟前
实战分享实现 C++ 管理类单例模式:特点与最佳实践
javascript·c++·单例模式
dFObBIMmai11 分钟前
如何撤销PUBLIC的危险权限_REVOKE EXECUTE ON UTL_FILE
jvm·数据库·python
2501_9012005312 分钟前
CSS如何优化移动端CSS选择器性能_遵循BEM规范避免过长嵌套
jvm·数据库·python
ㄟ留恋さ寂寞12 分钟前
如何用事务 Transaction 确保 IndexedDB 多表操作的安全性
jvm·数据库·python
m0_4954964112 分钟前
html标签怎样表示强调_em和i标签语义差异说明【操作】
jvm·数据库·python