一、什么是进程
进程是CPU、内存等资源分配的基本单位,程序运行时系统就会创建一个进程,并为它分配资源。
二、什么是线程
线程是程序执行时的最小单位,它是进程的一个执行流,是 CPU 处理器调度的基本单位。一个进程可以由很多个线程组成,线程间共享进程的所有资源。
三、进程和线程的区别
- 地址空间:同一进程的线程共享本进程的地址空间;而进程之间的地址空间是独立的。
- 资源拥有:同一进程的线程共享本进程的资源(如内存、I/O、CPU等);但进程之间的资源是独立的。
- 健壮性:一个进程崩溃不会对其他进程产生影响;但一个线程崩溃线程所在的进程就会死掉。
- 资源消耗:进程切换时资源消耗大,涉及到频繁切换,线程好于进程。
- 执行过程:每个进程都有独立的程序入口与顺序的执行序列;线程不能独立执行,必须存在于应用程序中。
- 并发性:线程和进程均可并发执行。
四、多进程与多线程的使用场景
- I/O密集型使用多线程。原因是:内存磁盘I/O使用率越高,线程等待时间就越长,因此需要启用更多线程继续使用CPU,以提高CPU的利用率。
- CPU密集型使用多进程。原因是:CPU密集,运行CPU读写I/O几乎没有阻塞,CPU一直会全速运行,因此CPU负载长期过高,单核情况下,开多线程是没有意义的,只有在多核CPU上、开多线程才可能提速。
- 频繁创建和销毁的优先使用多线程。
- 线程的切换速度快,所以在需要大量计算,切换频繁时使用线程。
- 任务间相关性较强用多线程。
- 需要更稳定安全时,适合选择进程,需要速度时,选择线程更好。
- 对 CPU 系统的效率使用上线程更占优势,所以多机分布的用进程,多核分布用线程。
五、注意事项
- GLI导致python在多线程编程中只能使用一个CPU,即无论多少个CPU核心,python程序只能在一个CPU上运行。