记录一次MySQL的分库分表行为

场景:原库因为数据量过大,导致慢查询漫天飞,总数据量已经千万以上,常见优化手段已经无效,初始设计没给足够时间应对这种场景方案和配套分离搭建,现在出时间到了。特殊场景:只有每天最新的数据会经常使用,范围广点也就是今天的数据,之前的数据极少使用,偶尔会出现一些调用。

一、分库分表核心策略

​时间范围分片(冷热分离)​​

​热库存储近期数据:将最近3个月(或高频访问周期)的数据单独存放于高性能数据库集群(如SSD存储),采用水平分表策略(如按天/周分表),满足高并发读写需求。

​冷库存储历史数据:超过时间阈值的数据迁移至低成本存储(如HDD或列式数据库),仅保留基本查询功能。可通过按月/年分库分表,降低单表数据量。

​动态分片规则​

​分片键选择:以时间字段(如create_time)为主分片键,结合业务ID哈希作为二级分片键,避免单一时间分片导致的数据倾斜。

​自动滚动分表:使用中间件(如ShardingSphere)配置时间间隔规则,例如按月自动创建新表,确保新数据写入最新分片,历史表只读。

二、架构优化关键点

​冷热数据迁移机制​

​异步归档工具:通过定时任务将冷数据迁移至历史库,迁移期间采用双写机制保证数据一致性,完成后触发索引重建。

​透明化路由:业务层通过中间件自动路由查询请求,近期数据访问热库,历史查询自动转发至冷库,对应用无感知。

​查询性能优化​

​热点数据缓存:对近期数据引入Redis缓存,减少数据库压力。

​历史数据索引优化:冷库采用压缩表格式(如InnoDB压缩表),并为常用查询字段建立覆盖索引。复杂查询可同步至Elasticsearch实现聚合分析。

​分布式事务处理​

​最终一致性补偿:跨冷热库操作采用异步消息队列(如RocketMQ)保证最终一致性,例如订单状态变更后异步更新冷库统计信息。

​本地事务+柔性事务:热库内事务使用本地ACID,跨库操作通过TCC模式(Try-Confirm-Cancel)回滚。

三、实施步骤与工具

​中间件选型​

方案:采用ShardingSphere,配置动态分片规则示例:

yaml

spring:

shardingsphere:

rules:

sharding:

tables:

order:

actual-data-nodes: ds_KaTeX parse error: Expected group after '_' at position 13: {0..1}.order_̲{202401...202412}

table-strategy:

interval:

datetime-pattern: "yyyy-MM-dd"

datetime-lower: "2024-01-01"

sharding-suffix-pattern: "yyyyMM"

datetime-interval-unit: "MONTHS"

此配置实现按月自动分表,新数据写入当月表,历史表只读。

​数据迁移与扩容​

​在线平滑迁移:使用ShardingSphere的Scaling模块,支持全量+增量数据同步,迁移期间业务无停机。

​虚拟分片扩容:预设逻辑分片数为实际分片的2倍(如16虚拟分片映射到8物理库),后续扩容时逐步填充新节点。

四、注意事项

​避免跨分片查询​

禁止直接JOIN冷热库,需通过业务层分别查询后聚合结果。

​监控与报警​

监控单分片容量(阈值75%)、慢查询比例,自动触发扩容或数据再平衡。

​灰度验证​

先拆分最核心表,验证无误后再扩展至其他业务表,保留原始表双写1个月作为回滚保障

相关推荐
Watink Cpper23 分钟前
[MySQL初阶]MySQL(1)MySQL的理解、库的操作、表的操作
linux·运维·服务器·数据库·c++·后端·mysql
尘世壹俗人29 分钟前
spark写数据库用连接池找不到driver类
大数据·数据库·spark
计算机学长大白1 小时前
Redis是什么?如何使用Redis进行缓存操作?
数据库·redis·缓存
焱焱枫1 小时前
PostgreSQL全页写机制深度解析:如何平衡WAL性能与数据可靠性
数据库·postgresql·wal性能
nicepainkiller3 小时前
go 分布式redis锁的实现方式
数据库·redis·redis分布式锁
007php0073 小时前
企微审批中MySQL字段TEXT类型被截断的排查与修复实践
大数据·开发语言·数据库·后端·mysql·重构·golang
苹果酱05673 小时前
利用机器学习进行信用风险评估
java·vue.js·spring boot·mysql·课程设计
Elastic 中国社区官方博客3 小时前
使用 Elasticsearch 进行集成测试初始化数据时的注意事项
大数据·数据库·elasticsearch·搜索引擎·集成测试·可用性测试
J不A秃V头A3 小时前
表关联查询:utf8mb4_general_ci和utf8mb4_0900_ai_ci两种不同的校对规则在操作符‘=‘时混用了
sql·mysql
V+zmm101343 小时前
美食推荐系统的微信小程序+论文源码调试讲解
java·数据库·微信小程序·小程序·毕业设计