MongoDB 分布式 概述

原文链接: 百度安全验证

未整理好,以下仅仅为关键内容笔记

MongoDB 中常用的分布式架构

1、Replica Set 副本集模式:一个 Primary 节点用于写入数据,其它的 Secondary 节点用于查询数据

2、Sharding 分片模式:将不同的数据分配在不同的机器中,也就是数据的横向扩展

Sharding 分片模式

分片(shard):每个分片包含一部分分片数据。每个分片可以部署为一个副本集;

MongoDB 在集合级别分片数据,将收集数据分布在集群中的各个分片上。

MongoDB 使用分片键在各个分片之间分发集合中的文档。分片键由文档中的一个或多个字段组成。

集合必须有一个以分片键开头的索引,如果集合本身没有对应的索引,在指定分片的时候会创建对应的索引。

MongoDB 的分片集群,数据会被均匀的分布在不同的 shard 中,对于每一个 shard 中的数据,是存储在一个个的 chunk 中的,每个 chunk 代表 shard 中的一部分数据。

简单就是使用 chunk 存储数据,方便集群进行数据在分片集群中进行数据的均衡迁移操作。

chunk 的大小选择很重要,集群默认的大小是 64 兆,可以根据业务大小进行调节。

较小的 chunksize

优点:数据均衡和迁移速度快,数据分布更均匀;

缺点:数据分裂频繁,路由节点消耗更多资源。

较大的 chunksize

优点:数据分裂少;

缺点:数据块移动集中消耗IO资源。

分片的算法

哈希分片

哈希分片会计算分片键字段值的哈希,然后根据哈希分片键值,每个块分配一个范围。

范围分片

MongoDB 中分片键划分数会根据数据范围,将不同范围内的数据划分到不同的分片中,同一个范围内的数据就能够分布在同一个分片中了。

相关推荐
数据与后端架构提升之路4 小时前
Seata 全景拆解:AT、TCC、Saga 该怎么选?告别“一把梭”的架构误区
分布式·架构
蓝眸少年CY9 小时前
什么是Hadoop
大数据·hadoop·分布式
不做码农好多年,该何去何从。9 小时前
zookeeper是什么可以做什么?
分布式·zookeeper·云原生
talle202113 小时前
Spark分布式计算框架介绍
大数据·分布式·spark·rdd
【赫兹威客】浩哥14 小时前
【赫兹威客】Hadoop完全分布式克隆文件部署教程
大数据·hadoop·分布式
编程彩机14 小时前
互联网大厂Java面试:从Spring Boot到分布式缓存的技术场景解析
java·redis·分布式·缓存·大厂面试·技术解析·sprint boot
蓝眸少年CY17 小时前
(第十三篇)spring cloud之Sleuth分布式链路跟踪
分布式·spring·spring cloud
德彪稳坐倒骑驴17 小时前
Spark面试准备
大数据·分布式·spark
小北方城市网17 小时前
Spring Cloud Gateway 生产级实践:高可用架构、灰度发布与故障排查
spring boot·redis·分布式·缓存·架构·wpf
奥特曼_ it18 小时前
【Spark+Hadoop】基于spark+hadoop游戏评论数据分析可视化大屏(完整系统源码+数据库+开发笔记+详细部署教程+虚拟机分布式启动教程)✅
hadoop·分布式·spark