进程、线程、协程
进程是计算机中的程序关于某数据集合上的一次运行活动,是系统进行资源分配和调度的基本单位。线程是进程中的一个实体,是被系统独立调度和分派的基本单位,线程自己不拥有系统资源,但可以访问同属进程下的所有资源。协程则是一种用户级的轻量级线程,完全由用户控制,上下文切换速度快,开销小。下面将具体介绍三者的区别:
-
进程:进程是计算机程序关于某个数据集的一次运行活动,是操作系统资源分配和调度的独立单位。每个进程都拥有独立的内存空间,进程间的切换开销较大,但相对安全和稳定。
-
线程:线程是进程中的一个实体,它不拥有系统资源但可访问进程资源。同一进程内的多个线程共享内存和资源,线程间的切换开销较小。多线程能够提高效率,但稳定性较低,一旦一个线程崩溃可能影响整个进程。
-
协程:协程是用户态的轻量级线程,完全由用户控制。协程拥有自己的寄存器上下文和栈,在切换时保存到其他地方,再次切换回来时恢复先前状态。协程的上下文切换非常快,开销极小,适用于大量并发任务。
上下文切换
上下文切换是操作系统中一个核心概念,它描述了当CPU从一个进程或线程切换到另一个进程或线程时所进行的操作。这一过程包括保存当前执行任务的状态,并恢复另一个任务的状态,以便继续执行。这种机制确保了多任务环境中的公平调度和多任务执行。为了更好地理解上下文切换的概念,可以从以下几个方面进行深入分析:
- 上下文切换的类型
- 进程上下文切换:发生在不同进程之间的切换,涉及资源全面保存和恢复,开销较大。
- 线程上下文切换:同一进程内的线程切换只涉及内核态资源的保存和恢复,开销较小。
- 中断上下文切换:响应硬件事件的中断处理,打断正常进程调度,仅涉及内核态资源。
- 上下文切换的过程
- 状态保存:当前执行的任务状态(如寄存器、程序计数器等)被保存到PCB(进程控制块)或TCB(线程控制块)中。
- 调度:操作系统的调度器选择下一个要执行的任务。
- 状态恢复:新任务的状态从PCB或TCB恢复到CPU中,继续执行。
- 上下文切换的触发因素
- 时间片耗尽:每个任务在CPU上运行的时间片用完,需切换到下一个任务。
- I/O操作:任务等待I/O操作完成时,会切换到其他任务。
- 高优先级任务到来:高优先级任务抢占CPU资源,导致当前任务被挂起。
- 锁竞争:任务在获取锁时被阻塞,触发上下文切换。
- 上下文切换的性能影响
- CPU资源消耗:每次切换需要CPU周期来保存和恢复状态。
- 缓存失效:切换导致CPU缓存失效,降低内存访问效率。
- 任务延迟:频繁切换导致任务无法立即执行,增加处理延迟。
- 吞吐量下降:过多的上下文切换降低系统整体吞吐量。
- 减少上下文切换的方法
- 合理分配时间片:根据任务特性调整时间片长度,减少不必要的切换。
- 优先级与亲和性调度:智能分配优先级,考虑处理器亲和性,减少切换次数。
- 减少锁的使用:优化程序设计,降低锁的需求,减少切换。
- 使用协程和用户级线程:减少内核级切换,提高响应速度。
- 异步I/O操作:对于I/O密集型任务,使用异步操作减少等待时间。
- 负载均衡:在多处理器系统中合理分配任务,避免过载。
线程组和线程优先级
在Java中,线程组(ThreadGroup)和线程优先级(Thread Priority)是两个重要的概念,它们对多线程编程和管理提供了支持。下面将详细探讨这两个概念:
线程组(ThreadGroup)
线程组是Java中用于组织和管理线程的一种机制。线程组可以包含多个线程或其他线程组,形成一个树状的结构。这种结构有助于批量控制线程的行为,如批量启动或停止线程,以及处理线程中的未捕获异常。
- 主要功能 :
- 批量操作:线程组可以对其内的所有线程执行批量操作,如中断、暂停等。
- 异常处理:线程组能够捕获并处理其内部线程抛出的未捕获异常,增强程序的健壮性。
- 权限管理:线程组可以用来限定线程的操作权限,增加安全性。
- 数据结构 :
- 线程组内部维护了多个成员变量,包括父线程组、最大优先级、是否为守护线程、线程数组等。这些数据结构确保了线程组的功能性和灵活性。
- 构造函数 :
- 线程组的构造函数允许指定父线程组和线程组的名称,同时可以设置线程组的最大优先级等属性。
- 应用场景 :
- 线程组常用于需要对大量线程进行统一管理的场合,如在多线程的服务器应用中管理客户端连接。
线程优先级(Thread Priority)
线程优先级是操作系统用于决定线程调度顺序的一个指标。在Java中,线程优先级是一个从1到10的整数,其中1是最低优先级,10是最高优先级。
- 主要作用 :
- 影响调度:高优先级的线程更有可能先于低优先级的线程执行,但具体执行顺序由操作系统的调度算法决定。
- 提高响应性:通过合理设置优先级,可以提高关键任务的响应速度。
- 设置优先级 :
- 可以使用
setPriority(int newPriority)
方法来设置线程的优先级。需要注意的是,不同操作系统可能对优先级的支持程度不同。
- 可以使用
- 优先级不保证 :
- 虽然高优先级的线程更易获得执行机会,但优先级并不保证线程的执行顺序,实际执行情况受多种因素影响。
- 默认优先级 :
- 默认情况下,新创建的线程继承其父线程的优先级。主线程的默认优先级为5。
结合使用
在实际编程中,线程组和线程优先级通常结合使用,以实现对线程的有效管理和调度。例如,可以创建不同的线程组来分类管理不同类型的线程,并通过设置不同的优先级来调整它们的执行顺序。
线程状态以及主要转化方法
Java线程状态
在Java中,线程可以处于以下六种状态之一:
-
NEW: 线程对象已创建但尚未启动。这是指线程已经实例化,但还没有调用start()方法。
-
RUNNABLE: 线程正在运行或等待CPU时间片。当线程的start()方法被调用后,线程就处于这个状态。它不一定正在执行,可能正在等待CPU分配时间片。
-
BLOCKED: 线程等待监视器锁。当线程尝试进入一个已经被其他线程持有锁的同步代码块时,它会被阻塞,直到锁被释放。
-
WAITING: 线程等待另一个线程执行特定动作。线程调用了如Object.wait()或Thread.join()等方法,会进入这个状态,直到其他线程调用notify()或notifyAll()方法唤醒它。
-
TIMED_WAITING: 线程等待另一个线程执行特定动作达到指定时间。与WAITING类似,但线程会在指定的时间后自动唤醒,无论是否有其他线程的干预。
-
TERMINATED: 线程已执行完毕。线程的run()方法完成执行后,线程就会进入这个状态。
线程状态转换
线程状态的转换是多线程编程中的一个重要概念,理解这些转换有助于更好地管理和控制线程的行为。下面是对线程状态转换的一些详细解释:
BLOCKED与RUNNABLE状态的转换
当一个线程尝试获取一个已经被其他线程持有的锁时,它会被置于BLOCKED状态。一旦持有锁的线程释放了锁,等待的线程可以获取锁并转换为RUNNABLE状态,前提是操作系统的调度器将CPU时间片分配给它。
WAITING状态与RUNNABLE状态的转换
- Object.wait(): 当一个线程调用了某个对象的wait()方法,它会进入WAITING状态,直到另一个线程调用同一个对象的notify()或notifyAll()方法。被唤醒后,线程并不立即运行,而是变为RUNNABLE状态,等待CPU的时间片分配。
- Thread.join(): 当一个线程A调用另一个线程B的join()方法时,线程A会进入WAITING状态,直到线程B完成执行。线程B完成后,线程A变为RUNNABLE状态。
TIMED_WAITING与RUNNABLE状态转换
- Thread.sleep(long): 使当前线程暂停执行指定的时间段,进入TIMED_WAITING状态。睡眠时间结束后,线程自动进入RUNNABLE状态。
- Object.wait(long): 类似于无条件的wait(),但等待时间有限。超时后,线程自动进入RUNNABLE状态。
- Thread.join(long): 类似于无条件的join(),但等待时间有限。超时后,线程自动进入RUNNABLE状态。
中断机制
线程中断是一种协作机制,通过设置线程的中断标志来请求线程停止正在执行的操作。需要注意的是,中断请求不一定会立即停止线程,具体行为取决于被中断线程如何处理这个中断请求。
- Thread.interrupt(): 设置线程的中断标志为true。
- Thread.interrupted(): 检查当前线程的中断标志,如果是true则返回true并将标志设置为false。
- Thread.isInterrupted(): 检查当前线程的中断标志,如果是true则返回true,但不改变中断标志的状态。
线程通信
锁与同步
在Java中,锁是一种同步工具,用于控制多线程对共享资源的访问。锁确保了在同一时刻只有一个线程能够访问特定的资源或代码区段,从而避免了并发问题。同步则是通过使用锁或其他同步机制来控制多个线程之间的执行顺序,以确保数据的一致性和完整性。
等待/通知机制
等待/通知机制是通过Object类的wait()、notify()和notifyAll()方法实现的。当一个线程调用某个对象的wait()方法时,它会释放该对象上的锁并进入等待状态,直到其他线程调用同一个对象的notify()或notifyAll()方法唤醒它。这种机制允许线程之间进行有效的协作。
信号量
信号量是一种计数信号量,用于控制同时访问特定资源的线程数量。Java中的Semaphore类提供了信号量的实现,可以用来限制同时进入特定代码区的线程数。
管道
管道是一种线程间的通信方式,它允许一个线程将数据流传递给另一个线程。Java提供了PipedWriter和PipedReader(基于字符的流)以及PipedOutputStream和PipedInputStream(基于字节的流)来实现管道通信。
其他通信相关
join方法
join()方法是Thread类的一个实例方法,它允许一个线程等待另一个线程完成其执行。这在需要确保子线程完成后主线程才能继续执行的情况下非常有用。
sleep方法
sleep()方法是Thread类的一个静态方法,它使当前线程暂停执行指定的时间。与wait()不同,sleep()不会释放锁。
ThreadLocal类
ThreadLocal类提供了线程局部变量,每个线程可以独立地保存和读取自己的副本变量,而不会影响其他线程。这对于存储线程特定的数据非常有用,例如用户ID或事务ID。
InheritableThreadLocal
InheritableThreadLocal是ThreadLocal的一个特殊版本,它允许子线程继承其父线程的ThreadLocal变量。这意味着子线程可以访问其父线程设置的本地变量值。