前提
-
进程"指的是fork(2)系统调用的产物
-
线程"指的是pthread_create()的产物,因此是宝贵的那种原生线程。而且Pthreads是NPTL的,每个线程由clone(2)产生,对应一个内核的task_struct。
Pthreads是一组线程操作的标准,NPTL是 Native POSIX Thread Library 的缩写,是Linux上实现Pthreads标准的一个库。NPTL是Pthreads在Linux平台上的具体实现。NPTL提供了线程创建、同步、互斥、条件变量等功能。
必须使用单线程的场合
-
程序可能会 fork(2);
-
限制程序的CPU占用率。 8核服务器,单线程只在一个核上跑,cpu使用率也只有 12.5%
一个程序fork(2)之后一般有两种行为:
- 立刻执行exec(),变身为另一个程序。例如shell和inetd;又比如 lighttpd fork()出子进程,然后运行fastcgi程序。或者集群中运行在计算节点上的负责启动job的守护进程。
- 不调用exec(),继续运行当前程序。要么通过共享的文件描述符与父进程通信,协同完成任务;要么接过父进程传来的文件描述符,独立完成工作。
event loop 的缺点
添加图片注释,不超过 140 字(可选)
多线程没有绝对的性能优势
-
IO Bound 和CPU Bound ,任何一方早早先达到瓶颈,多线程都没有啥优势!
-
IO bound和CPU bound是指在计算机系统中,任务执行的瓶颈主要是由I/O操作或者CPU运算所决定。
IO bound(输入输出受限)是指任务的执行时间主要被I/O操作所消耗。CPU的利用率相对较低,大部分时间会处于等待I/O完成的状态。
CPU bound(计算受限)是指任务的执行时间主要被CPU计算所消耗。计算密集型任务,CPU的利用率相对较高,大部分时间会用于执行计算操作。
-
如果任务是IO bound,则可能需要优化I/O子系统来提高整体性能;
-
如果任务是CPU bound,则可能需要考虑使用多线程、并行处理等方式来充分利用 CPU 资源。
适用多线程程序的场景
目的
提高响应速度,让IO和"计算"相互重叠,降低latency延迟。虽然多线程不能提高绝对性能,但能提高平均响应性能。
一个程序要做成多线程的,大致要满足:
-
有多个CPU可用。
-
线程间有共享数据,即内存中的全局状态。
-
共享的数据是可以修改的,而不是静态的常量表。如果数据不能修改,那么可以在进程间用 shared memory
-
提供非均质的服务。即事件的响应有优先级差异,可以用专门的线程来处理优先级高的事件。防止优先级反转。
-
latency (延迟 )和throughput (吞吐量) 同样重要,不是逻辑简单的IO bound或CPU bound程序。换言之,程序要有相当的计算量。
-
利用异步操作。比如logging。无论往磁盘写log file,还是往log server发送消息都不应该阻塞关键路径。
-
能 scale up。一个好的多线程程序应该能享受增加CPU数目带来的好处。
-
具有可预测的性能。随着负载增加,性能缓慢下降,超过某个临界点之后会急速下降。线程数目一般不随负载变化。
-
多线程能有效地划分责任与功能,让每个线程的逻辑比较简单,任务单一,便于编码。而不是把所有逻辑都塞到一个event loop里,不同类别的事件之间相互影响。