MySQL分库分表后的主键策略：跨越分布式难题，保持全局唯一ID的智慧实践

引言：

随着业务规模的不断扩大，单个MySQL数据库承载的数据量到达极限时，分库分表便成为一种常见的数据库水平扩展方案。然而，在分库分表后，如何妥善处理原本全局唯一的ID主键成为了一个必须面对的技术挑战。本文将深入剖析这一问题，并探讨几种可行的主键生成策略。

一、单库自增ID的问题

在单库环境下，MySQL的auto_increment属性可以轻松实现主键自增，确保每一行数据的ID是全局唯一的。但是，一旦进行了分库分表，每个独立的数据库或表将有自己的auto_increment计数器，这样一来，自增ID就会在各个数据库或表之间重复，不再满足全局唯一的要求。

二、分布式环境下的主键生成策略

全局唯一ID生成服务
- UUID: 使用UUID（Universally Unique Identifier）生成全局唯一的字符串ID。虽然解决了唯一性问题，但长度较长，且无序，不利于索引优化。
- 雪花算法（Snowflake）: 结合时间戳、工作机器ID、序列号等信息生成64位整型ID，特点是短小、有序、全局唯一，适用于分布式系统。
- 集中式ID生成服务：例如使用Redis、Zookeeper等中间件，通过原子操作生成连续的ID序列，如Redis的INCR命令或者使用Redission的分布式锁配合自增序列。
- 数据库Sequence表：在单独的数据库中设立一个专门用于生成ID的Sequence表，各个数据库分片通过请求这个Sequence表获取下一个ID。
复合主键

除了单一主键，还可以考虑使用复合主键，如（shard_id, local_id）的形式，其中shard_id标识分片，local_id在每个分片内自增。

三、实践案例

例如，在使用雪花算法的情况下，可以创建一个ID生成器，通过生成的ID不仅能够在分库分表的环境中保证全局唯一，还能反映ID生成的时间先后顺序，有利于数据排序和查询优化。

java 复制代码

// 示例伪代码
public class SnowflakeIdGenerator {
    private long workerId; // 工作节点ID
    private long dataCenterId; // 数据中心ID
    private long sequence = 0L; // 序列号
    private long twepoch = 1577808000000L; // 开始时间截 (2020-01-01)

    public synchronized long nextId() {
        // 获取当前时间戳（毫秒）
        long timestamp = timeGen();

        // 如果当前时间小于上一次ID生成的时间戳，说明系统时钟回退过这个时候应当抛出异常
        if (timestamp < lastTimestamp) {
            throw new RuntimeException(
                String.format("Clock moved backwards.  Refusing to generate id for %d milliseconds", lastTimestamp - timestamp));
        }

        // 同一毫秒内，序列号自增
        if (lastTimestamp == timestamp) {
            sequence = (sequence + 1) & sequenceMask;
            // 当前毫秒内序列溢出
            if (sequence == 0) {
                // 阻塞到下一个毫秒,获得新的时间戳
                timestamp = tilNextMillis(lastTimestamp);
            }
        } else {
            // 时间戳改变，序列重置
            sequence = 0L;
        }

        // 上次生成ID的时间截
        lastTimestamp = timestamp;

        // 移位并通过或运算拼到一起组成64位的ID
        return ((timestamp - twepoch) << timestampLeftShift) //
               | (dataCenterId << datacenterIdShift) //
               | (workerId << workerIdShift) //
               | sequence;
    }
    // ... 其他实现细节
}

四、总结

处理MySQL分库分表后的ID主键问题，关键是实现全局唯一ID的生成。不同的策略各有优缺点，选择时需结合业务需求、系统规模和性能要求综合考虑。在实践中，既要确保ID的全局唯一性，也要兼顾ID的大小、顺序性和生成效率，以达到最优的数据库设计效果。