MongoDB Chunks核心概念与机制

1. 基础定义
  • Chunk(块) ‌:MongoDB分片集群中数据的逻辑存储单元,由一组连续的片键(Shard Key)范围数据组成,默认大小为‌64MB‌(可调整范围为1-1024MB)‌。
  • 数据分布逻辑‌:分片集群通过记录Chunk与分片(Shard)的映射关系管理数据存储,而非直接跟踪每条数据的位置‌。
2. Chunk生命周期
  1. 初始状态

    新分片的集合默认生成一个覆盖全片键范围([minKey, maxKey])的Chunk,存储在‌primary shard‌上‌。

  2. ‌**自动分裂(Splitting)**‌

    • 触发条件 ‌:当Chunk大小超过chunkSize(默认64MB)时,MongoDB自动将其拆分为更小的Chunk‌。
    • 分裂规则 ‌:
      • 首次分裂时,若Chunk数≤3,分裂阈值为1MB;随着Chunk数量增加,阈值逐步升高至chunkSize‌3。
      • 分裂后更新元数据至‌config server‌,并在mongos缓存中同步路由信息‌。
  3. 手动分裂

通过splitAt()splitFind()函数指定片键值强制拆分,适用于预分片(Pre-splitting)优化场景‌。

Chunk迁移与均衡

Balancer触发迁移‌:当分片间Chunk数量差异≥9时,Balancer自动迁移Chunk以实现负载均衡‌

迁移流程

  1. 从源分片复制Chunk数据到目标分片。
  2. 更新config server元数据及mongos路由缓存。
  3. 删除源分片上的旧Chunk数据‌
关键配置与管理
配置项 作用 示例命令/参数 来源
shardCollection 为集合启用分片 sh.shardCollection("db.coll", {key:1})
chunkSize 定义Chunk初始大小 sh.setBalancerMaxChunkSize(128)
sh.disableBalancer() 临时关闭Balancer以维护 sh.disableBalancer("db.coll")
sh.status() 查看Chunk分布及迁移状态 sh.status()
相关推荐
gb421528710 分钟前
mysql数据库中某个数据表的碎片率自己降低了,mysql数据表对碎片率有自动优化机制吗?
数据库·mysql
AI大模型顾潇29 分钟前
[特殊字符] 本地大模型编程实战(29):用大语言模型LLM查询图数据库NEO4J(2)
前端·数据库·人工智能·语言模型·自然语言处理·prompt·neo4j
有时间要学习29 分钟前
MySQL——数据类型&&表的约束
数据库·mysql
AI改变未来1 小时前
数据库常见故障排查
数据库
bing_1581 小时前
MongoDB 的核心概念(文档、集合、数据库、BSON)是什么?
数据库·mongodb·oracle
feilieren1 小时前
Windows 安装 Milvus
数据库·ai·milvus
kngines1 小时前
【PostgreSQL数据分析实战:从数据清洗到可视化全流程】附录-D. 扩展插件列表(PostGIS/PostgREST等)
数据库·postgresql·数据分析·pgvector·扩展插件·postgrest·向量数据
星星点点洲1 小时前
【Redis】谈谈Redis的设计
数据库·redis·缓存
HelloZheQ1 小时前
MVCC:数据库并发控制的利器
服务器·数据库·oracle
珹洺2 小时前
Jsp技术入门指南【十四】实现基于MySQL+JDBC+JSP数据库验证的登录界面与登录跳转功能
java·运维·数据库·mysql·servlet