从单主机到多主机——分布式系统的不断推进

[1. 单机架构](#1. 单机架构)

[2. 什么叫分布式系统](#2. 什么叫分布式系统)

[2.1 负载均衡](#2.1 负载均衡)

[2.2 数据库分离](#2.2 数据库分离)

[2.2.1 数据库读写分离](#2.2.1 数据库读写分离)

[2.2.2 数据库分库分表](#2.2.2 数据库分库分表)

今天我们来聊一聊分布式系统。

1. 单机架构

单机架构 是一种集中式的系统部署架构 ，指整个应用或计算任务的所有组件（包括数据存储、计算逻辑、业务处理等）都运行在一台独立的物理服务器或虚拟机上，所有的资源调用和数据交互都在这台机器内部完成，不依赖其他外部节点。

我们看下面这张图，单机架构的话其实就类似于下面这样，所有用户的请求都是由一台主机来进行接收已经回复的。

资源独占所有硬件资源（CPU、内存、磁盘、显卡等）都为当前任务或应用服务，不会与其他节点共享。比如一台个人电脑上运行的单机版办公软件，就是典型的单机架构。
架构简单无需设计节点间的通信、协同机制，开发和部署成本低，适合小型应用或简单任务。
局限性明显
- 性能上限受单台机器的硬件配置限制，无法通过扩展节点来提升算力；
- 可靠性差，一旦这台机器故障，整个系统就会瘫痪；
- 难以处理大规模数据和高并发请求。

因此我们在单机架构的基础上引入了分布式系统，用来解决单机架构的局限性问题。

分布式系统 是由多个地理上分散、通过网络连接的独立计算节点（服务器、计算机等）组成的系统，这些节点协同工作，对外呈现为一个统一的整体，共同完成单台机器难以承担的复杂任务。

我们看下面这张图片，这就是分布式架构，通过增加主机的数量，来使用户的请求得到快速的回应。

接下来的内容就都是关于当前架构的不断升级，来使它能够适应各种场合。

负载均衡在这里就是指用户的各种请求能够平均的分配到各个主机，来让程序维持在相对的一种稳定状态。

当然，负载均衡在这里跟多的是一种思想，就跟贪心算法一样，我们可以根据这个思想来设计各种各样的算法来实现这个思想。防止某一台主机承接过多请求，导致响应变慢甚至宕机。

下面这几种是一般来说比较常见的实现负载均衡的算法。

当然，一般来说我们会把算法设置到负载均衡器里面，通过负载均衡器来实现任务的分配。

类似于下面这张图片这样。用户的任务会先给负载均衡器，然后负载均衡器来把任务交给各个主机。

数据库的分离就是和上面的负载均衡思想不同的东西。当然它们的目的是一样的，都是为了更好更有效的利用主机资源。

简答来说就是更改数据库里面存储的内容，来实现更加高效的数据调用。因为已经提前知道了每一个数据库里面存放的内容，所以这样查找起来会格外的快。

读写分离就是根据用户请求的不同来进行分类，从而实现数据库的分离。

我们来看下面这个图片，读写分离的话就是根据用户请求的操作不同来进行分类。

由于操作的不同，所以在这里会导致数据的不一致问题，所以在这边我们还需要会通过特定的同步机制，来让数据库达到一致。

这个的话我们要先了解一个叫做二八定律的东西，在这里这个二八定律是指只有20%的数据会得到频繁访问，而80%的数据则很少被访问。所以我们就根据这个特性来设计主机里面的数据库。把常用的分到多几个库，把不常用的分到少几个库，这样就实现了数据库分库分表，从而提升了回应速度。

就像下面这张图一样。