apache经典模型和nginx参数配置

Apache 几个经典的Web服务端

①Apache prefork 模型

● 预派生模式，有一个主控制进程，然后生成多个子进程，使用select模型，最大并发 1024
● 每个子进程有一个独立的线程响应用户请求
● 相对比较占用内存，但是比较稳定，可以设置最大和最小进程数
● 是最古老的一种模式, 也是最稳定的模式，适用于访问量不是很大的场景
▲ 优点：稳定
■ 缺点：每个用户请求需要对应开启一个进程 , 占用资源较多，并发性差 , 不适用于高并发场景

②Apache worker 模型

● 一种多进程和多线程混合的模型
● 有一个控制进程，启动多个子进程
● 每个子进程里面包含固定的线程
● 使用线程程来处理请求
● 当线程不够使用的时候会再启动一个新的子进程, 然后在进程里面再启动线程处理请求，
● 由于其使用了线程处理请求，因此可以承受更高的并发
▲ **优点：**相比prefork 占用的内存较少，可以同时处理更多的请求
■ 缺点：使用keepalive 的长连接方式，某个线程会一直被占据，即使没有传输数据，也需要一直等待到超时才会被释放。如果过多的线程，被这样占据，也会导致在高并发场景下的无服务线程可用（该问题在prefork模式下，同样会发生）

③Apache event模型

● Apache中最新的模式， 2012 年发布的 apache 2.4.X 系列正式支持 event 模型 , 属于事件驱动模型
● 每个进程响应多个请求，在现在版本里的已经是稳定可用的模式
● 它和worker 模式很像，最大的区别在于，它解决了 keepalive 场景下长期被占用的线程的资源浪费问题（某些线程因为被keepalive ，空挂在哪里等待，中间几乎没有请求过来，甚至等到超时）
● MPM中，会有一个专门的线程来管理这些 keepalive 类型的线程
当有真实请求过来的时候，将请求传递给服务线程，执行完毕后，又允许它释放。这样增强了高并发场景下的请求处理能力
▲ 优点：单线程响应多请求，占据更少的内存，高并发下表现更优秀，会有一个专门的线程来管理keep-alive类型的线程，当有真实请求过来的时候，将请求传递给服务线程，执行完毕后，又允许它释放
■ **缺点：**没有线程安全控制

服务端I/O流程

I/O 在计算机中指 Input/Output ， IOPS (Input/Output Per Second) 即每秒的输入输出量 ( 或读写次数 ) ，是衡量磁盘性能的主要指标之一。IOPS 是指单位时间内系统能处理的 I/O 请求数量，一般以每秒处理的 I/O请求数量为单位， I/O 请求通常为读或写数据操作请求。
一次完整的 I/O 是用户空间的进程数据与内核空间的内核数据的报文的完整交换，但是由于内核空间与用户空间是严格隔离的，所以其数据交换过程中不能由用户空间的进程直接调用内核空间的内存数据，而是需要经历一次从内核空间中的内存数据copy 到用户空间的进程内存当中，所以简单说 I/O 就是把数据从内核空间中的内存数据复制到用户空间中进程的内存当中。

服务器的I/O：

● 磁盘I/O
● 网络I/O : 一切皆文件 , 本质为对 socket 文件的读写
磁盘 I/O
磁盘 I/O 是进程向内核发起系统调用，请求磁盘上的某个资源比如是 html 文件或者图片，然后内核通过相应的驱动程序将目标文件加载到内核的内存空间，加载完成之后把数据从内核内存再复制给进程内存，如果是比较大的数据也需要等待时间
网络 I/O
网络通信就是网络协议栈到用户空间进程的 IO 就是网络 IO

网络 I/O 处理过程
获取请求数据，客户端与服务器建立连接发出请求，服务器接受请求（ 1-3 ）
构建响应，当服务器接收完请求，并在用户空间处理客户端的请求，直到构建响应完成（ 4 ）
返回数据，服务器将已构建好的响应再通过内核空间的网络 I/O 发还给客户端（ 5-7 ）
不论磁盘和网络 I/O
每次 I/O ，都要经由两个阶段：
第一步：将数据从文件先加载至内核内存空间（缓冲区），等待数据准备完成，时间较长
第二步：将数据从内核缓冲区复制到用户空间的进程的内存中，时间较短

I/O模型

模型相关概念

同步 / 异步：关注的是消息通信机制，即调用者在等待一件事情的处理结果时，被调用者是否提供完成状态的通知。
同步： synchronous ，被调用者并不提供事件的处理结果相关的通知消息，需要调用者主动询问事情是否处理完成
异步： asynchronous ，被调用者通过状态、通知或回调机制主动通知调用者被调用者的运行状态

阻塞/ 非阻塞**：**关注调用者在等待结果返回之前所处的状态
阻塞： blocking ，指 IO 操作需要彻底完成后才返回到用户空间，调用结果返回之前，调用者被挂
起，干不了别的事情。
非阻塞： nonblocking ，指 IO 操作被调用后立即返回给用户一个状态值，而无需等到 IO 操作彻底完成，在最终的调用结果返回之前，调用者不会被挂起，可以去做别的事情。

网络I/O模型

阻塞型、非阻塞型、复用型、信号驱动型、异步

①阻塞型I/O模型（blocking IO）

● 阻塞 IO 模型是最简单的 I/O 模型，用户线程在内核进行 IO 操作时被阻塞
● 用户线程通过系统调用read 发起 I/O 读操作，由用户空间转到内核空间。内核等到数据包到达后，然后将接收的数据拷贝到用户空间，完成read 操作
● 用户需要等待read 将数据读取到 buffer 后，才继续处理接收的数据。整个 I/O 请求的过程中，用户线程是被阻塞的，这导致用户在发起IO 请求时，不能做任何事情，对 CPU 的资源利用率不够
**优点：**程序简单，在阻塞等待数据期间进程 / 线程挂起，基本不会占用 CPU 资源
**缺点：**每个连接需要独立的进程 / 线程单独处理，当并发请求量大时为了维护程序，内存、线程切换开销较apache 的 preforck 使用的是这种模式。
**同步阻塞：**程序向内核发送 I/O 请求后一直等待内核响应，如果内核处理请求的 IO 操作不能立即返回 , 则进程将一直等待并不再接受新的请求，并由进程轮询查看I/O 是否完成，完成后进程将 I/O 结果返回给Client，在 IO 没有返回期间进程不能接受其他客户的请求，而且是有进程自己去查看 I/O 是否完成，这种方式简单，但是比较慢，用的比较少

②非阻塞型I/O模型(nonblocking IO)

用户线程发起 IO 请求时立即返回。但并未读取到任何数据，用户线程需要不断地发起 IO 请求，直到数据到达后，才真正读取到数据，继续执行。即 " 轮询 " 机制存在两个问题：如果有大量文件描述符都要等，那么就得一个一个的read 。这会带来大量的 Context Switch （ read 是系统调用，每调用一次就得在用户态和核心态切换一次）。轮询的时间不好把握。这里是要猜多久之后数据才能到。等待时间设的太长，程序响应延迟就过大; 设的太短，就会造成过于频繁的重试，干耗 CPU 而已，是比较浪费 CPU 的方式，一般很少直接使用这种模型，而是在其他IO 模型中使用非阻塞 IO 这一特性。
非阻塞：程序向内核发送请 I/O 求后一直等待内核响应，如果内核处理请求的 IO 操作不能立即返回 IO 结果，进程将不再等待，而且继续处理其他请求，但是仍然需要进程隔一段时间就要查看内核I/O 是否完成。
查看上图可知，在设置连接为非阻塞时，当应用进程系统调用 recvfrom 没有数据返回时，内核会立即返回一个 EWOULDBLOCK 错误，而不会一直阻塞到数据准备好。如上图在第四次调用时有一个数据报准备好了，所以这时数据会被复制到应用进程缓冲区，于是 recvfrom 成功返回数据
当一个应用进程这样循环调用 recvfrom 时，称之为轮询 polling 。这么做往往会耗费大量 CPU 时间，实际使用很少

③多路复用I/O型(I/O multiplexing)

上面的模型中 , 每一个文件描述符对应的 IO 是由一个线程监控和处理
多路复用 IO 指一个线程可以同时（实际是交替实现，即并发完成）监控和处理多个文件描述符对应各自的IO ，即复用同一个线程
一个线程之所以能实现同时处理多个 IO, 是因为这个线程调用了内核中的 SELECT,POLL 或 EPOLL 等系统调用，从而实现多路复用IO

I/O multiplexing 主要包括 :select ， poll ， epoll 三种系统调用， select/poll/epoll 的好处就在于单个process就可以同时处理多个网络连接的 IO 。
它的基本原理就是 select/poll/epoll 这个 function 会不断的轮询所负责的所有 socket ，当某个 socket 有数据到达了，就通知用户进程。
当用户进程调用了 select ，那么整个进程会被 block ，而同时， kernel 会 " 监视 " 所有 select 负责的 socket ，当任何一个socket 中的数据准备好了， select 就会返回。这个时候用户进程再调用 read 操作，将数据从kernel拷贝到用户进程。
Apache prefork 是此模式的 select ， worker 是 poll 模式。
IO 多路复用（ IO Multiplexing) ：是一种机制，程序注册一组 socket 文件描述符给操作系统，表示 " 我要监视这些fd 是否有 IO 事件发生，有了就告诉程序处理 "IO 多路复用一般和 NIO 一起使用的。 NIO 和 IO 多路复用是相对独立的。NIO 仅仅是指 IO API 总是能立刻返回，不会被 Blocking; 而 IO 多路复用仅仅是操作系统提供的一种便利的通知机制。操作系统并不会强制这俩必须得一起用，可以只用IO 多路复用 + BIO ，这时还是当前线程被卡住。IO 多路复用和 NIO 是要配合一起使用才有
实际意义
IO 多路复用是指内核一旦发现进程指定的一个或者多个 IO 条件准备读取，就通知该进程多个连接共用一个等待机制，本模型会阻塞进程，但是进程是阻塞在select 或者 poll 这两个系统调用上，而不是阻塞在真正的IO 操作上用户首先将需要进行 IO 操作添加到 select 中，同时等待 select 系统调用返回。当数据到达时，IO 被激活， select 函数返回。用户线程正式发起 read 请求，读取数据并继续执行从流程上来看，使用select函数进行 IO 请求和同步阻塞模型没有太大的区别，甚至还多了添加监视 IO ，以及调用 select 函数的额外操作，效率更差。并且阻塞了两次，但是第一次阻塞在select 上时， select 可以监控多个 IO 上是否已有IO 操作准备就绪，即可达到在同一个线程内同时处理多个 IO 请求的目的。而不像阻塞 IO 那种，一次只能监控一个IO 虽然上述方式允许单线程内处理多个 IO 请求，但是每个 IO 请求的过程还是阻塞的（在 select 函数上阻塞），平均时间甚至比同步阻塞IO 模型还要长。如果用户线程只是注册自己需要的 IO 请求，然后去做自己的事情，等到数据到来时再进行处理，则可以提高CPU 的利用率 IO 多路复用是最常使用的 IO 模型，但是其异步程度还不够" 彻底 " ，因它使用了会阻塞线程的 select 系统调用。因此 IO 多路复用只能称为异步阻塞IO 模型，而非真正的异步 IO
优缺点
优点：可以基于一个阻塞对象，同时在多个描述符上等待就绪，而不是使用多个线程 ( 每个文件描述符一个线程) ，这样可以大大节省系统资源
缺点：当连接数较少时效率相比多线程 + 阻塞 I/O 模型效率较低，可能延迟更大，因为单个连接处理需要 2 次系统调用，占用时间会有增加
IO 多路复用适用如下场合：
当客户端处理多个描述符时（一般是交互式输入和网络套接口），必须使用 I/O 复用
当一个客户端同时处理多个套接字时，此情况可能的但很少出现
当一个服务器既要处理监听套接字，又要处理已连接套接字，一般也要用到 I/O 复用
当一个服务器即要处理 TCP ，又要处理 UDP ，一般要使用 I/O 复用
当一个服务器要处理多个服务或多个协议，一般要使用 I/O 复用

④信号驱动式I/O模型(signal-driven IO)

信号驱动 I/O 的意思就是进程现在不用傻等着，也不用去轮询。而是让内核在数据就绪时，发送信号通知进程。
调用的步骤是，通过系统调用 sigaction ，并注册一个信号处理的回调函数，该调用会立即返回，然后主程序可以继续向下执行，当有I/O 操作准备就绪 , 即内核数据就绪时，内核会为该进程产生一个 SIGIO 信号，并回调注册的信号回调函数，这样就可以在信号回调函数中系统调用 recvfrom 获取数据 , 将用户进程所需要的数据从内核空间拷贝到用户空间
此模型的优势在于等待数据报到达期间进程不被阻塞。用户主程序可以继续执行，只要等待来自信号处理函数的通知。
在信号驱动式 I/O 模型中，应用程序使用套接口进行信号驱动 I/O ，并安装一个信号处理函数，进程继续运行并不阻塞
在信号驱动式 I/O 模型中，应用程序使用套接口进行信号驱动 I/O ，并安装一个信号处理函数，进程继续运行并不阻塞
当数据准备好时，进程会收到一个 SIGIO 信号，可以在信号处理函数中调用 I/O 操作函数处理数据。
**优点：**线程并没有在等待数据时被阻塞，内核直接返回调用接收信号，不影响进程继续处理其他请求因此可以提高资源的利用率
**缺点：**信号 I/O 在大量 IO 操作时可能会因为信号队列溢出导致没法通知
异步阻塞：程序进程向内核发送 IO调用后，不用等待内核响应，可以继续接受其他请求，内核收到进程请求后进行的 IO 如果不能立即返回，就由内核等待结果，直到IO 完成后内核再通知进程。

⑤异步I/O模型(asynchronous IO)

异步 I/O 与信号驱动 I/O 最大区别在于，信号驱动是内核通知用户进程何时开始一个 I/O 操作，而异步 I/O 是由内核通知用户进程I/O 操作何时完成，两者有本质区别 , 相当于不用去饭店场吃饭，直接点个外卖，把等待上菜的时间也给省了
相对于同步I/O ，异步 I/O 不是顺序执行。用户进程进行 aio_read 系统调用之后，无论内核数据是否准备好，都会直接返回给用户进程，然后用户态进程可以去做别的事情。等到socket 数据准备好了，内核直接复制数据给进程，然后从内核向进程发送通知。IO 两个阶段，进程都是非阻塞的。
信号驱动 IO 当内核通知触发信号处理程序时，信号处理程序还需要阻塞在从内核空间缓冲区拷贝数据到用户空间缓冲区这个阶段，而异步IO 直接是在第二个阶段完成后，内核直接通知用户线程可以进行后续操作了
优点：异步 I/O 能够充分利用 DMA 特性，让 I/O 操作与计算重叠
缺点：要实现真正的异步 I/O ，操作系统需要做大量的工作。目前 Windows 下通过 IOCP 实现了真正的异步 I/O ，在 Linux 系统下， Linux 2.6 才引入，目前 AIO 并不完善，因此在 Linux 下实现高并发网络编程时以 IO 复用模型模式 + 多线程任务的架构基本可以满足需求
Linux 提供了 AIO 库函数实现异步，但是用的很少。目前有很多开源的异步 IO 库，例如 libevent 、 libev 、libuv。
异步非阻塞：程序进程向内核发送 IO 调用后，不用等待内核响应，可以继续接受其他请求，内核调用的IO如果不能立即返回，内核会继续处理其他事物，直到 IO 完成后将结果通知给内核，内核在将 IO 完成的结果返回给进程，期间进程可以接受新的请求，内核也可以处理新的事物，因此相互不影响，可以实现较大的同时并实现较高的IO 复用，因此异步非阻塞使用最多的一种通信方式。

Nginx架构和安装

Nginx 介绍
Nginx ： engine X ， 2002 年开发，分为社区版和商业版 (nginx plus )
2019 年 3 月 11 日 F5 Networks 6.7 亿美元的价格收购
Nginx 是免费的、开源的、高性能的 HTTP 和反向代理服务器、邮件代理服务器、以及 TCP/UDP 代理服务器
解决 C10K 问题（ 10K Connections ）
Nginx 官网： http://nginx.org
nginx 的其它的二次发行版：
Tengine ：由淘宝网发起的 Web 服务器项目。它在 Nginx 的基础上，针对大访问量网站的需求，添加
了很多高级功能和特性。 Tengine 的性能和稳定性已经在大型的网站如淘宝网，天猫商城等得到了
很好的检验。它的最终目标是打造一个高效、稳定、安全、易用的 Web 平台。从 2011 年 12 月开始，
Tengine 成为一个开源项目官网 : http://tengine.taobao.org/
OpenResty ：基于 Nginx 与 Lua 语言的高性能 Web 平台，章亦春团队开发，官网： http://openr
esty.org/cn/
Nginx 功能
● 静态的 web 资源服务器 html ，图片， js ， css ， txt 等静态资源
● http/https协议的反向代理
● 结合FastCGI/uWSGI/SCGI 等协议反向代理动态资源请求
● tcp/udp协议的请求转发（反向代理）
● imap4/pop3协议的反向代理
Nginx 进程间通信
工作进程是由主进程生成的，主进程使用 fork() 函数，在 Nginx 服务器启动过程中主进程根据配置文件决定启动工作进程的数量，然后建立一张全局的工作表用于存放当前未退出的所有的工作进程，主进程生成工作进程后会将新生成的工作进程加入到工作进程表中，并建立一个单向的管道并将其传递给工作进程，该管道与普通的管道不同，它是由主进程指向工作进程的单向通道，包含了主进程向工作进程发出的指令、工作进程ID 、工作进程在工作进程表中的索引和必要的文件描述符等信息。
主进程与外界通过信号机制进行通信，当接收到需要处理的信号时，它通过管道向相关的工作进程发送正确的指令，每个工作进程都有能力捕获管道中的可读事件，当管道中有可读事件的时候，工作进程就会从管道中读取并解析指令，然后采取相应的执行动作，这样就完成了主进程与工作进程的交互。

worker 进程之间的通信原理基本上和主进程与 worker 进程之间的通信是一样的，只要 worker 进程之间能够取得彼此的信息，建立管道即可通信，但是由于worker 进程之间是完全隔离的，因此一个进程想要知道另外一个进程的状态信息, 就只能通过主进程来实现。
为了实现 worker 进程之间的交互， master 进程在生成 worker 进程之后，在 worker 进程表中进行遍历，将该新进程的PID 以及针对该进程建立的管道句柄传递给 worker 进程中的其他进程，为 worker 进程之间的通信做准备，当worker 进程 1 向 worker 进程 2 发送指令的时候，首先在 master 进程给它的其他 worker 进程工作信息中找到2 的进程 PID ，然后将正确的指令写入指向进程 2 的管道， worker 进程 2 捕获到管道中的事件后，解析指令并进行相关操作，这样就完成了worker 进程之间的通信。
另 worker 进程可以通过共享内存来通讯的，比如 upstream 中的 zone ，或者 limit_req 、 limit_conn 中的zone等。操作系统提供了共享内存机制

Nginx安装

Nginx 版本
● Mainline version 主要开发版本 , 一般为奇数版本号 , 比如 1.19
● Stable version 当前最新稳定版 , 一般为偶数版本 , 如 :1.20
● Legacy versions 旧的稳定版 , 一般为偶数版本 , 如 :1.18
Nginx 安装可以使用 yum 或源码安装，但是推荐使用源码编译安装
● yum的版本比较旧
● 编译安装可以更方便自定义相关路径
● 使用源码编译可以自定义相关功能，更方便业务的上的使用
Nginx 编译安装
先去官网右键复制你需要的nginx版本的链接

然后wgert下载

下载源码安装所需要的软件