MongoDB Chunks核心概念与机制

1. 基础定义
  • Chunk(块) ‌:MongoDB分片集群中数据的逻辑存储单元,由一组连续的片键(Shard Key)范围数据组成,默认大小为‌64MB‌(可调整范围为1-1024MB)‌。
  • 数据分布逻辑‌:分片集群通过记录Chunk与分片(Shard)的映射关系管理数据存储,而非直接跟踪每条数据的位置‌。
2. Chunk生命周期
  1. 初始状态

    新分片的集合默认生成一个覆盖全片键范围([minKey, maxKey])的Chunk,存储在‌primary shard‌上‌。

  2. ‌**自动分裂(Splitting)**‌

    • 触发条件 ‌:当Chunk大小超过chunkSize(默认64MB)时,MongoDB自动将其拆分为更小的Chunk‌。
    • 分裂规则 ‌:
      • 首次分裂时,若Chunk数≤3,分裂阈值为1MB;随着Chunk数量增加,阈值逐步升高至chunkSize‌3。
      • 分裂后更新元数据至‌config server‌,并在mongos缓存中同步路由信息‌。
  3. 手动分裂

通过splitAt()splitFind()函数指定片键值强制拆分,适用于预分片(Pre-splitting)优化场景‌。

Chunk迁移与均衡

Balancer触发迁移‌:当分片间Chunk数量差异≥9时,Balancer自动迁移Chunk以实现负载均衡‌

迁移流程

  1. 从源分片复制Chunk数据到目标分片。
  2. 更新config server元数据及mongos路由缓存。
  3. 删除源分片上的旧Chunk数据‌
关键配置与管理
配置项 作用 示例命令/参数 来源
shardCollection 为集合启用分片 sh.shardCollection("db.coll", {key:1})
chunkSize 定义Chunk初始大小 sh.setBalancerMaxChunkSize(128)
sh.disableBalancer() 临时关闭Balancer以维护 sh.disableBalancer("db.coll")
sh.status() 查看Chunk分布及迁移状态 sh.status()
相关推荐
Linux运维技术栈22 分钟前
【实战+原理】微软云 Azure Database 私有网络接入模式全解析:从子网委派到Private Endpoint
数据库·microsoft·azure
小熊h30 分钟前
MySQL集群高可用架构——组复制 (MGR)
linux·数据库·mysql
sunshine-sm1 小时前
CentOS Steam 9安装 MySQL 8
linux·运维·服务器·数据库·mysql·centos·centos stream
IT果果日记2 小时前
详解DataX开发达梦数据库插件
大数据·数据库·后端
烧冻鸡翅QAQ2 小时前
redis的数据类型:List
数据库·redis·list
蒋士峰DBA修行之路2 小时前
实验五 静态剪枝
数据库·算法·剪枝
蒋士峰DBA修行之路2 小时前
实验六 动态剪枝
数据库·算法·剪枝
kimble_xia@oracle3 小时前
SQL 笔记
java·数据库·oracle
树谷-胡老师4 小时前
公元前3400年至公元2024年全球国家地理边界演变数据集
数据库·arcgis·信息可视化
疯狂的Alex4 小时前
2010-2022 同等学力申硕国考:软件工程简答题真题汇总
数据库·oracle·软件工程