高可用与扩展：主从复制、读写分离与分库分表

各位架构师、数据库的"领航员"，大家好！今天我们来聊聊数据库架构的"终极进化论"。

当你的业务从"小作坊"变成"大工厂"，单台数据库就像一辆满载的拖拉机，拉不动了。这时候，你需要的不是给拖拉机换个更大的轮胎（加内存、加CPU），而是把它变成一列高铁。

这就是我们今天要讲的主题：高可用与扩展------从主从复制到分库分表，看MySQL如何从"单兵作战"进化为"集团军"。

主从复制的本质，就是日志的传输与回放。

底层流程（三步走）：

主从延迟是架构师最头疼的问题。

原因：
- 单线程回放：在 MySQL 5.7 之前，Slave 的 SQL 线程是单线程的。Master 多线程写入，Slave 单线程回放，必然积压。
- 大事务：Master 上执行一个删除 100 万行数据的操作只需几秒，Slave 回放时可能要几分钟。
解决方案 ：
- MySQL 5.7+ 并行复制 ：基于 LOGICAL_CLOCK，允许不同表或无冲突的事务并行回放。
- 半同步复制：Master 写完日志后，必须等至少一个 Slave 收到并写入 Relay Log 才返回成功。虽然牺牲了写性能，但保证了数据不丢。

当读请求远大于写请求时，我们需要把读流量分摊到从库。这时候，中间件（如 ShardingSphere、MyCat、ProxySQL）就登场了。

它就像一个智能路由器，挡在应用和数据库之间。

SQL解析 ：中间件拦截 SQL，判断是读还是写。
- SELECT → 路由到 Slave。
- INSERT/UPDATE/DELETE → 路由到 Master。
负载均衡：如果有多个 Slave，中间件会根据策略（轮询、权重）分配读请求。

场景：

架构师解法：

当单表数据突破 500w-1000w，索引树太高，磁盘 I/O 太慢，这时候必须进行分库分表。

这是真正的"核武器"。将一张表的数据分散到多个库/表中。

分片策略（Sharding Strategy）：

分库分表后，自增 ID 不能用了（不同表 ID 会重复）。
Snowflake 原理 ：

生成一个 64 位的 Long 型 ID：

优点：全局唯一、趋势递增、高性能。

分库后，JOIN 操作失效了。
解决方案：

分库分表是架构演进的"核武器"，威力大但副作用也大（运维复杂、跨库查询难）。不到万不得已（单表 500w-1000w+），不要轻易使用。

最后，送上金句 ：

"分库分表是架构演进的'核武器'，威力大但副作用也大（运维复杂、跨库查询难）。不到万不得已（单表 500w-1000w+），不要轻易使用。"