分布式数据库分片自动扩展

分片机制

某个数据表,分片数量是固定的,如256

当你执行 INSERTSELECT 时,数据库(或中间件 Proxy)会拿到你指定的 Shard Key(分片键),然后丢进公式里:

Shard_ID=Hash(Shard_Key)(mod256)Shard\_ID = Hash(Shard\_Key) \pmod{256}Shard_ID=Hash(Shard_Key)(mod256)

  • 结果永远在 0-255 之间: 无论数据量怎么变,只要你的分片键(比如 user_id)不变,计算出来的 Shard_ID 永远是同一个。

物理扩容

这张图非常清晰地展示了 TDSQL(以及类似架构的分布式数据库)是如何从逻辑分片 演进到物理扩容的过程。

我们可以把这张图分为三个阶段来解读:

1. 左侧:用户视角的"逻辑表" (G)

  • SQL 引擎 (Proxy): 这是用户直接接触的层。对你(开发者)来说,你看到的只有一张巨大的表 G
  • 透明性: 你不需要关心数据具体在哪。你只需要发送 SELECT * FROM G WHERE id = ...,SQL 引擎会自动帮你计算这行数据应该去哪个"小表"里找。

2. 中间:分片的"逻辑存在" (G0 - G255)

这里是理解分片的关键:在 TDSQL 中,数据表被预先切分成了固定数量的"逻辑分片"(也叫 Group)。

  • 预分片 (Pre-sharding): 图中显示表 G 被拆分成了 G0 到 G255,总共 256 个逻辑分片。
  • 初始状态 (Set 00): 在业务初期,数据量并不大。为了节省成本,这 256 个逻辑分片可以全部挤在 Set 00 这一个物理容器里(也就是一组 1 主 2 从的 MySQL 实例)。
  • 此时的卦象: 逻辑上是分布式的,但物理上是单点的。这时候性能瓶颈在于这个物理 Set 的 CPU 和磁盘。

3. 右侧:物理拆分与扩容 (Set 00 - Set 255)

当业务爆发,Set 00 的压力太大时,这张图的核心动作------拆分就发生了:

  • 物理迁徙: TDSQL 的调度系统会自动把逻辑分片搬家。例如,把 G1 搬到 Set 01 ,把 G255 搬到 Set 255
  • 负载均衡: 最终,每个物理 Set 只负责一部分逻辑分片。比如 Set 00 只管 G0,Set 01 管 G1。
  • 无限扩展: 如果 256 个 Set 还不满足需求,理论上你可以继续增加物理服务器。

分片迁移

这个过程通常被称为平滑迁移,其目标是在业务无感的情况下,将逻辑分片从一个物理 SET 搬迁到另一个物理 SET。

以下是分片迁移的详细深度拆解:

1. 分片迁移的标准过程

迁移过程通常分为四个关键阶段:

  1. 全量同步(Full Sync):
    • 系统在源 SET(源节点)上创建一个数据快照。
    • 将快照数据发送到目标 SET。此时,业务依然在源 SET 上进行读写。
  2. 增量同步(Incremental Sync):
    • 在全量迁移期间产生的增量数据(如 MySQL 的 Binlog),会通过实时解析并回放到目标 SET 中。
    • 目标 SET 追赶进度的过程是持续的,直到两边的数据差异(Lag)极小。
  3. 一致性校验:
    • 在切换前,后台会对源和目标的数据进行抽样或全量校验,确保搬迁没有导致数据损坏。
  4. 切流切换(Switch / Cutover):
    • 这是最关键的一步。系统会将路由信息指向新的 SET。

2. 是否有"锁"的参与?

现代分布式数据库追求 Lock-free(无锁)Minimal Lock(最小锁)

  • 全量与增量阶段:完全无锁。 业务读写不受影响。源库通过 MVCC(多版本并发控制)读取快照,不阻塞写操作。
  • 切换阶段:存在"瞬时禁写"。
    • 为了保证数据绝对一致,在路由信息正式更新前的最后几毫秒,源 SET 会进入一个极短的 ReadOnly(只读) 状态。
    • 在这几毫秒内,系统等待最后的增量日志追平。
    • 感官影响: 业务侧可能会感受到一个很小的耗时抖动(毫秒级),通常不会导致连接断开,只会有短暂的请求延迟增加。

3. 路由信息是怎么变化的?

路由信息的更新是实现"平滑"的关键,涉及到 Proxy(网关)元数据中心(Metadata/Catalog) 的配合:

  1. 元数据状态变更:
    • 当数据追平并准备切换时,调度中心会在元数据数据库(如 TDSQL 的 ZooKeeper 或内部元数据库)中将该分片的指向从 SET_A 更新为 SET_B
  2. 路由下发:
    • Proxy 会感知到元数据的变化。此时,旧的请求如果还在发往 SET_A,Proxy 会根据新的路由配置将其重定向到 SET_B
  3. 路由预热与刷新:
    • 有些架构会采用"预推"机制,先让 Proxy 知道即将切换,等真正切换指令下达时,Proxy 瞬间完成切换。
相关推荐
zh1570231 小时前
MongoDB备节点无法读取数据怎么解决_rs.slaveOk()与Secondary读取权限
jvm·数据库·python
m0_733565461 小时前
怎么对MongoDB数据进行批量部分更新_BulkWrite机制与性能优化
jvm·数据库·python
南村群童欺我老无力.1 小时前
鸿蒙PC链接数据库操作的并发与事务安全
数据库·安全·华为·harmonyos
天微微蓝sunny1 小时前
存储系统知识全景:从一块磁盘到分布式块存储
分布式
dblens 数据库管理和开发工具1 小时前
SQLite 不该只有“打开表格”,它也需要一个 Agent 工作台
数据库·sqlite
dblens 数据库管理和开发工具1 小时前
我给 SQLite 做了一个带 Agent 的桌面工具
数据库·sqlite
m0_463672201 小时前
如何理解闭包对内存的影响并手动解除引用防止泄漏
jvm·数据库·python
m0_736439301 小时前
如何处理无法修改主键列的问题_先删除AUTO_INCREMENT再移除主键的顺序
jvm·数据库·python
学编程的小程1 小时前
WHERE 子句里的“暗雷“:当函数副作用撞上数据库优化器
数据库