高可用（High Availability, HA）

高可用（High Availability, HA）的核心是消除单点故障（Single Point of Failure, SPOF）。即系统中任何一个组件坏了，整个系统都不会挂，用户几乎无感知。

通常用"几个9"来衡量可用性：

注意：100%的可用性在现实中不存在，因为计划内维护（如升级、打补丁）也需要时间。

高可用主要通过冗余和自动故障转移来实现。

1. 主备模式

2. 主主模式

3. 集群模式

4. 数据层高可用

要实现真正的高可用，必须满足以下技术条件：

条件	说明	关键技术
1. 冗余无单点	所有可能故障的组件（服务器、网络、电源）都至少有两份。	双网卡绑定、双电源、多机多活、RAID磁盘阵列
2. 故障自动检测	能快速、准确判断节点是"真故障"还是"网络抖动"，避免误切换。	心跳检测、健康检查（Ping/端口/接口）、Quorum仲裁机制
3. 自动切换（Failover）	检测到故障后，系统自动将VIP或流量切换到备用节点，无需人工介入。	VIP漂移（如Keepalived）、DNS切换（需短TTL）、负载均衡摘除节点
4. 数据一致性保障	切换后，新主节点的数据必须完整且最新，不能出现"脑裂"（两个主节点同时写数据）。	共享存储（SAN/NAS）、分布式一致性协议（Raft/Paxos）、 fencing（隔离故障节点）
5. 快速恢复能力	故障节点修复后能快速重新加入集群，自动同步缺失的数据。	增量数据同步、全量数据重建机制

常见的LVS + Keepalived + Nginx + MySQL主从架构：

总结： 高可用就是用一堆普通机器 和一套自动容灾机制 ，模拟出一台永不掉线的超级机器的效果。代价是成本增加和架构复杂度提升。

高可用需要多台服务器 ，其中服务层多实例部署 ，而数据库/缓存层采用主从复制或集群，这两层通常跑在不同服务器上，避免资源冲突

高可用要求任何一个组件（服务器、进程、磁盘、网络）失效时，仍有其他冗余组件能接管工作。但这并不意味着每台服务器上都要把"所有服务+所有数据库"都部署一份。这样做反而会带来资源冲突、数据竞争、维护复杂等问题。

做法：通常是主从复制 或集群。
- 主库（Active）负责读写，部署在服务器A。
- 从库（Standby/Read-only）同步数据，部署在服务器B（或更多）。
- 主库故障时，将从库提升为新主库。
特点：并不是两台服务器都同时提供写服务（双主模式除外，但双主风险高）。从库平时可能只读，或者完全不接受流量。
结论：❌ 不是"两套数据库都同时对外提供完整服务"，而是一套主用，一套热备/只读。

假设你有两台物理机，每台都运行：Nginx + Ocelot + MySQL + Redis。

问题	说明
端口冲突	两台机器各自运行 MySQL 占用 3306 端口没问题（不同IP），但你的应用程序要连接哪个 MySQL？如果都连本机的，数据就不一致。
数据不一致	两个 MySQL 独立运行，没有复制关系，写入 A 机的数据 B 机看不到，切换后数据丢失。
资源浪费	数据库和缓存非常消耗内存、CPU、磁盘 I/O。每台都跑全量数据库，硬件成本翻倍，且备用机平时几乎闲置。
维护复杂	升级、备份、监控都要做两份，且要处理两套数据之间的同步问题，比标准的主从复制复杂得多。

假设你有 4 台物理机/虚拟机：

服务层：Ocelot 在 A、B 上都运行，Nginx 通过 Consul 发现所有 Ocelot 实例，流量分发到 A 和 B。一台 Ocelot 挂了，Nginx 切到另一台。
数据层：MySQL 主从复制，Redis 主从复制。C 故障时，D 接管成为新主。
入口层：VIP 绑定在 A 的 Nginx，A 故障时 VIP 漂移到 B。

这样一共 4 台服务器，没有一台运行"所有组件"，但实现了高可用。